由于前一阵的瓶颈造成一些排名数据损坏掉了,而我自己竟然没有发现,多亏默燃发现并通知我。写了个过滤程序打算把错误数据过滤一下,结果发现排名监控的表格已经达到1900万多的记录,单表的磁盘空间占用达到3.3GB。过滤程序跑了一天也没有过滤完成。考虑到最近回报查看排名监控变慢的声音,决定将表格分割。接下来的工作变的异常顺利,几个小时就分割并过滤完毕了。通过小范围询问,都反映排名监控速度好多了,不负我辛苦啊。再次感谢默燃。
另外感谢Fox,Fox发现一个百度的细节,会提升数据的准确性。虽然还没有应用到追词上,还是很感谢Fox的分享。
This entry was posted on 2009-09-08, 10:21 and is filed under 开发日志. You can follow any responses to this entry through RSS 2.0. You can leave a response, or trackback from your own site.
#1 by 丫丫月儿 on 2009-09-08 - 10:39
相信追词会越来越好!
#2 by 默燃 on 2009-09-08 - 16:20
支持追词,关注追词是每个追词用户的责任!不用这么客气孙兄!顶下!
#3 by 佘星星 on 2009-09-08 - 17:51
追词会更好的发展
#4 by 湖南SEO on 2009-09-09 - 00:02
希望追词网越做越好,功能越来越强大!
#5 by xx on 2009-09-09 - 12:50
一个表就3G多…