| 名称 | 状态 | 说明 |
|---|---|---|
| BasicTS | 时空预测 Benchmark,含多种模型与交通、气象等数据集,持续维护。 | |
| LargeST | 大规模交通预测数据集,含众多 baseline,实现与评估皆可用。 |
| 名称 | 状态 | 说明 |
|---|---|---|
| AMiner | 社交、学术、知识图谱、流行病等多领域数据集。 | |
| awesome-twitter-data | Twitter 相关数据集列表。 | |
| OpenDataLab | 面向大模型的开放数据平台,涵盖 NLP、CV、图、多模态、时序、生物、物理等。 |
| 名称 | 状态 | 说明 |
|---|---|---|
| Open Academic Graph (OAG) | 微软提供的融合微软学术与 AMiner 的学术网络图。 | |
| SNAP | 斯坦福大型网络数据集集合。 |
| 名称 | 状态 | 说明 |
|---|---|---|
| the open parallel corpus | 大型平行语料库,覆盖多语言多领域。 | |
| Statistical Machine Translation | 国际机器翻译大赛数据集,权威且使用广泛,偏新闻领域。 |