谷歌新闻机器人是如何工作的


How does Google News Robot works?

我正在用Symfony2构建一个新项目,我需要从几个网站上拉一些文章到我的网站。我知道我必须小心如何显示这些信息,但这不是重点。

我的问题是,我怎样才能造出一个能捡起那些文章的机器人?然后,我想,我必须在我的代码中检查它,并过滤那些带有标签、标题或关键词的文章。

我应该使用哪种技术?php能做到吗?我需要什么?哪种知识?我应该使用RSS吗?答案越精确越好(如果你有参考文献的话)!

谢谢

它本质上与搜索引擎相同,只是对新闻网站做了一些调整。Udacity提供了一个搜索引擎基础课程,所以你可以从那里开始。