我正在构建一个提要聚合器。我有很多博客地址,我想把所有的帖子都保存在数据库中。我使用Simplepie获取提要,然后使用php将它们插入数据库。Simplepie的API非常大,我不知道应该保存帖子的哪些部分。到目前为止,我正在保存:
- ID
- 标题
- 日期
- Permalink
- 作者
- 说明
- 内容
我想知道我应该在数据库中保存哪些其他内容。我不知道整个API,而且很长。
您可以采用逆向工程方法。
挑选一些你已经拥有的提要,查看url源,看看提要中有什么标签。在检查了一些之后,你应该能够确定大多数提要包含什么,并决定如何设置数据库。
例如,这是一个提要url:
feeds.feedburner.com/webresourcesdepot?format=xml
你可以把它放在浏览器中,查看源代码,然后找到一个包含提要内容的部分,并确定它们有什么标签。
您还可以浏览RSS规范,并查看有效RSS提要的所有有效选项。
http://cyber.law.harvard.edu/rss/rss.html