查看原文
其他

【Github】Chinese-poetry: 最全中华古诗词数据库

AINLP 2020-10-22

上次我们玩了一下自动作诗机:"自动作诗机"上线,代码和数据都是公开的,基于该项目下自带的数据和模型。不过这方面还有一个诗词数据更全的Github项目:chinese-poetry/chinese-poetry


"最全中华古诗词数据库, 唐宋两朝近一万四千古诗人, 接近5.5万首唐诗加26万宋诗. 两宋时期1564位词人,21050首词。"


Github链接,点击阅读原文可以直达,推荐Star:

https://github.com/chinese-poetry/chinese-poetry




中文诗歌主页是一个基于浏览器的诗词网站, 包含唐诗三百首、宋词三百首等文集.

最全的中华古典文集数据库, 包含5.5万首唐诗、26万首宋诗和2.1万首宋词. 唐宋两朝近1.4万古诗人, 和两宋时期1.5K词人. 数据来源于互联网.

为什么要做这个仓库? 古诗是中华民族乃至全世界的瑰宝, 我们应该传承下去, 虽然有古典文集, 但大多数人并没有拥有这些书籍. 从某种意义上来说, 这些庞大的文集离我们是有一定距离的。而电子版方便拷贝, 所以此开源数据库诞生了. 你可以用此数据做任何有益的事情, 甚至我也可以帮助你.

古诗采集没有记录过程, 因为古诗数据庞大,目标网站有限制, 采集过程经常中断超过了一个星期.2017年新加入全宋词, 全宋词爬取过程及数据分析.

数据集合

  • 全唐诗 json

  • 全宋诗 json

  • 全宋词 ci

  • 五代·花间集 wudai

  • 五代·南唐二主词 wudai

  • 论语 lunyu

  • 诗经 shijing

  • 幽梦影 youmengying

  • 四书五经 sishuwujing

  • 蒙學 mengxue

待补充

  • 清代诗词

  • 元曲

案例展示

  • animalize / QuanTangshi 离线全唐诗 Android

  • justdark / pytorch-poetry-gen a char-RNN based on pytorch

  • Clover27 / ancient-Chinese-poem-generator Ancient-Chinese-Poem-Generator

  • chinese-poetry / poetry-calendar 诗词周历

  • chenyuntc / pytorch-book 简体唐诗生成(char-RNN), 可生成藏头诗,自定义诗歌意境,前缀等

  • okcy1016 / poetry-desktop 诗词桌面

  • huangjianke / weapp-poem 诗词墨客 小程序版


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存