怎样榨取微信文章里的有用信息?

背景

早些时候,微信公布已经有了 800 万公众号。有人推测,现在这个数字已经超过了 1000 万。

从一些途径了解到,所有公众号中活跃(持续发文章)的有差不多 100 万。按每个号平均每天发 1 篇文章频率来推测,每天在微信公众平台上大约能生成上百万的文章。

不仅文章数量巨大,在文章的形式上也是花样翻新。从最早的图文、视频,到后来支持投票,到再后来支持音乐,再到后来支持语音,加上各种第三方内容生成工具的帮助,微信图文信息的内容的形式不可谓不丰富。

那么问题来了,能不能分析一篇文章中包含哪些内容呢?

微信文章里有哪些有用信息?

比如,文章的标题、作者、发布时间、原文链接等。进一步,......