偶做了一个Cnbeta新闻采集的小程序,可以导出RSS文件,配合SA的导入功能,可以一下子导入采集的新闻,目前已经做好163滚动新闻,国际新闻,国内新闻,娱乐新闻,crsky软件,Cnbeta新闻进行自动采集。
本软件为绿色免费软件,解压后即可以使用!版权所有,盗版不究!
开发平台:
Delphi7 + WindowsXP SP2
测试平台:
WindowsXP SP2 / Windows2000 Server / Windows 2003
(其它平台未测试,只要是Windows系统应该都兼容的)
功能简介:
自动采集新闻标题,网站URL地址,新闻详细内容,新闻description部分自动过滤HTML代码,自动采集完整的新闻详细内容。
定时采集,自动过滤重复的新闻,导出RSS XML文件,
日志管理,数据支持ACC数据库和MSSQL数据库(也可以用于其它网站的导入功能)
使用说明:
点击采集新闻,软件是单线程进行采集(不会用多线程,呵呵,不要丢砖谢谢),等待采集完成以后,导出文件即可,输出的文件是XML文件,可直接导入到Sablog博客中,(注意:如果你的博客是UTF-8编码格式的话,请用转换工具如EditPlus打开导出的XML文件,另存为UTF-8格式即可),另外当新闻导出后,数据库会自动记录新闻为“已导出”状态,如果点“全部初始化”,会将数据库中所有已经采集的新闻置为“未导出”状态,可以再次导出所有新闻。
为配合Sablog导入,偶简单修改过Admin\database.php 请大家下载后,先备份原文件,再覆盖database.php 文件即可。
如果是导入到其它系统的话,请使用data\data.mdb文件导入即可,cnbeta_news 为新闻表,cnbeta_log 为日志表
解压密码:samool.com
13 条评论
[quote=10000]samool你好: 请问这个采集器只能采集当天的新闻信息吗? 以往的就没办法采集了吗?[/quote]很久没有更新了,可以采集所有的文章的,有些功能没开放,说实话采集没什么用,还是原创的好,我以前采集太多,现在百度收集我的速度超慢..郁闷.
samool你好: 请问这个采集器只能采集当天的新闻信息吗? 以往的就没办法采集了吗?
[quote=咸水元子]samool好人+强人
习惯看最新评论,找到此文。
版权所有,盗版不究!
呵呵。[/quote]哈哈哈,多谢支持!!
[quote=why]yeah!~~ 不过还是可以用的,十分感谢。
可以加你Q吗?[/quote]加偶QQ:6042506
samool好人+强人
习惯看最新评论,找到此文。
版权所有,盗版不究!
呵呵。
yeah!~~ 不过还是可以用的,十分感谢。
可以加你Q吗?
今天用了出现这样的错误http://hiphotos.baidu.com/wanglea/pic/item/93b24c4ef34d3419b2de0568.jpg
不错..谢谢samool,可惜只能采集固定的网址
还是用DEDE的好
[quote=joff]已经不能用了![/quote]今天早上我测试过,可以用的啊。