提要中要保存在数据库中的最重要项目


Most important items from a feed to save in a DB

我正在构建一个提要聚合器。我有很多博客地址,我想把所有的帖子都保存在数据库中。我使用Simplepie获取提要,然后使用php将它们插入数据库。Simplepie的API非常大,我不知道应该保存帖子的哪些部分。到目前为止,我正在保存:

  • ID
  • 标题
  • 日期
  • Permalink
  • 作者
  • 说明
  • 内容

我想知道我应该在数据库中保存哪些其他内容。我不知道整个API,而且很长。

您可以采用逆向工程方法。

挑选一些你已经拥有的提要,查看url源,看看提要中有什么标签。在检查了一些之后,你应该能够确定大多数提要包含什么,并决定如何设置数据库。

例如,这是一个提要url:

feeds.feedburner.com/webresourcesdepot?format=xml

你可以把它放在浏览器中,查看源代码,然后找到一个包含提要内容的部分,并确定它们有什么标签。

您还可以浏览RSS规范,并查看有效RSS提要的所有有效选项。

http://cyber.law.harvard.edu/rss/rss.html