Document
命理与人格分析数据资源整理
整理日期:2026-05-18
塔罗、八字、星盘、MBTI 等方向可作为 AI 分析参考的数据集、算法库和知识源整理。
命理与人格分析数据资源整理
整理日期:2026-05-18
本文档只整理“可作为 AI 分析参考的数据 / 算法库 / 知识源”,不包含可直接安装的 agent skill。
这些资源适合用于 RAG 知识库、结构化规则库、提示词参考、模型评估或训练数据预处理。
类型说明
| 类型 | 作用 | 是否直接会分析 |
|---|---|---|
| 数据集 | 提供牌义、案例、文本、标签、训练样本 | 否,需要自行设计分析逻辑 |
| 算法库 | 计算八字、星盘、相位、测评分数等确定性结果 | 部分会算,解释通常交给 AI |
| RAG 知识库 | 把数据整理后供 AI 检索引用 | 依赖检索和提示词设计 |
| Skill | 教 AI 按什么流程分析 | 是,偏工作流;不在本文重点范围内 |
推荐使用路线
- 塔罗:用结构化牌义数据做知识库,再叠加牌阵规则。
- 八字:优先使用确定性排盘算法库,AI 只负责解释排盘结果。
- 星座 / 西洋占星:用算法库计算星盘、宫位、相位,再让 AI 解读。
- MBTI:优先用测评题库或开放人格模型打分;文本推断类数据只能作为弱参考。
塔罗数据
Blacik/tarot-card-meanings-78
- 链接:https://huggingface.co/datasets/Blacik/tarot-card-meanings-78
- 内容:78 张塔罗牌的结构化牌义数据。
- 常见字段:牌名、正位含义、逆位含义、爱情、事业、yes/no、星座或行星对应等。
- 适合用途:
- 塔罗 RAG 知识库。
- 牌义检索。
- 牌阵解读提示词。
- 将牌义转成 JSON / SQLite / 向量库。
- 使用建议:
- 保留原始字段,不要直接混成一段长文本。
- 可按“大阿尔卡那 / 小阿尔卡那 / 权杖 / 圣杯 / 宝剑 / 星币”建立分类索引。
- 解读时把“牌义”和“牌阵位置”分开处理,避免 AI 混淆。
jakeveo05/divination-combined
- 链接:https://huggingface.co/datasets/jakeveo05/divination-combined
- 内容:综合占卜数据,包含星座运势、神秘学文本、塔罗解读、八字、塔罗牌义等。
- 规模:约 41,034 条。
- 适合用途:
- 多领域命理分析语料参考。
- 塔罗 / 星座 / 八字风格模板。
- 做分类、标签体系、提示词样例。
- 注意事项:
- 包含生成式文本,质量需要抽样检查。
- 不建议不清洗就直接用于微调。
- 更适合先做 RAG 或提示词参考。
八字 / 命理数据与算法
GitHub bazi topic
- 链接:https://github.com/topics/bazi
- 内容:GitHub 上与八字相关的开源项目集合。
- 适合用途:
- 查找八字排盘算法。
- 查找干支、节气、十神、五行、大运、流年的计算逻辑。
- 对比不同项目对真太阳时、节气切换、日柱计算的处理差异。
- 使用建议:
- 八字分析应先用程序产出稳定排盘结果,再交给 AI 做解释。
- 不建议让 AI 直接从出生时间“脑算”八字,容易出现基础盘错误。
wolke/bazi-mingli
- 链接:https://github.com/wolke/bazi-mingli
- 类型:八字 / 命理相关 skill 与规则资料项目。
- 适合用途:
- 参考八字分析流程。
- 提取五行、十神、日主强弱、用神、大运流年等解释框架。
- 拆成自己的提示词模板或知识库。
- 使用建议:
- 可作为“分析框架参考”,但实际排盘仍建议接入稳定算法库。
- 如果用于商业产品,要单独检查许可证和内容来源。
jakeveo05/tcm-divination-training
- 链接:https://huggingface.co/datasets/jakeveo05/tcm-divination-training
- 内容:综合中医与命理训练数据,包含八字、紫微、易经、风水、中医、星座、塔罗等。
- 规模:约 162K+ 样本。
- 适合用途:
- 中文 / 英文 / 越南语命理类语料参考。
- 构建多领域命理助手的初始数据池。
- 做主题分类、问答样例、解释风格参考。
- 注意事项:
- 数据量大但来源复杂,必须抽样评估。
- 不适合直接作为“权威知识库”。
- 更适合作为候选语料,筛选后再进入 RAG 或训练流程。
星座 / 西洋占星数据与算法
Kerykeion
- 链接:https://kerykeion.net/
- 类型:Python 西洋占星算法库。
- 能力:计算本命盘、行星位置、宫位、相位、行运等。
- 适合用途:
- 生成结构化星盘数据。
- 构建星盘分析 AI 的确定性计算层。
- 将星盘结果转给 AI 做文本解释。
- 使用建议:
- 星座分析不要只使用“每日星座运势”文本。
- 更稳的方式是:出生时间地点 -> 星盘计算 -> 结构化结果 -> AI 解读。
- 输出给 AI 时建议包含太阳、月亮、上升、行星落座、宫位、主要相位。
Swiss Ephemeris / pyswisseph
- 相关链接:https://pypi.org/project/pyswisseph/
- 类型:天文历表计算库 / Python 绑定。
- 适合用途:
- 更底层、更精确的行星位置计算。
- 需要严格星历数据时使用。
- 注意事项:
- Swiss Ephemeris 有许可证要求,商业使用前要确认授权。
- 如果只是个人分析或原型验证,可以先用 Kerykeion 降低接入复杂度。
MBTI / 人格分析数据
Shunian/kaggle-mbti-cleaned
- 链接:https://huggingface.co/datasets/Shunian/kaggle-mbti-cleaned
- 内容:Kaggle MBTI 文本分类数据的清洗版本。
- 规模:约 409,785 行。
- 适合用途:
- 文本人格倾向分类实验。
- MBTI 标签分布分析。
- 训练或评估文本分类器。
- 注意事项:
- MBTI 标签多为用户自报,存在偏差。
- Reddit / 社区文本容易学习到话题偏好,而不是真实人格。
- 不建议把模型输出包装成确定人格结论。
MBTIBench
- 链接:https://arxiv.org/abs/2412.12510
- 内容:用于 MBTI 人格检测的大模型 benchmark 与数据研究。
- 特点:关注旧 MBTI 数据集的标签错误、数据偏差和评估问题。
- 适合用途:
- 做 MBTI 文本推断模型评估。
- 参考更严谨的人格数据标注方法。
- 对比传统 Kaggle MBTI 数据的缺陷。
- 使用建议:
- 如果目标是“严肃人格分析”,优先参考这类 benchmark 的评估方式。
- 如果只是娱乐产品,可以用更轻量的测评题和解释模板。
OpenJung / OEJTS
- 链接:https://github.com/openjung/core
- 类型:开放式 Jung / MBTI-like 测评框架。
- 内容:32 题、1-5 分制、四个维度评分,输出类似 MBTI 的人格类型。
- 适合用途:
- 构建开放版 MBTI 测评。
- 避免直接依赖官方 MBTI 版权体系。
- 作为 AI 人格分析前的结构化输入。
- 使用建议:
- 推荐“测评结果 + 用户文本 + AI 分析”组合使用。
- 不建议只靠用户几句话直接推断 MBTI。
建议的数据处理结构
塔罗牌义 JSON 示例
{
"card": "The Fool",
"arcana": "major",
"upright": ["new beginnings", "freedom", "spontaneity"],
"reversed": ["recklessness", "risk", "naivety"],
"love": "...",
"career": "...",
"yes_no": "yes",
"associations": {
"element": "air",
"planet": "uranus"
}
}
八字分析输入示例
{
"birth": {
"datetime": "1995-08-21 14:30:00",
"timezone": "Asia/Shanghai",
"location": "Shanghai, China"
},
"chart": {
"year_pillar": "...",
"month_pillar": "...",
"day_pillar": "...",
"hour_pillar": "..."
},
"derived": {
"ten_gods": [],
"five_elements": {},
"day_master_strength": "...",
"luck_pillars": []
}
}
星盘分析输入示例
{
"birth": {
"datetime": "1995-08-21 14:30:00",
"timezone": "Asia/Shanghai",
"location": "Shanghai, China"
},
"natal_chart": {
"sun": {"sign": "...", "house": 0},
"moon": {"sign": "...", "house": 0},
"ascendant": {"sign": "..."},
"planets": [],
"aspects": []
}
}
MBTI 分析输入示例
{
"questionnaire": {
"source": "OpenJung/OEJTS",
"scores": {
"E_I": 0,
"S_N": 0,
"T_F": 0,
"J_P": 0
},
"type": "INTJ"
},
"user_text_samples": [],
"analysis_goal": "self-reflection"
}
重要注意事项
- 版权与许可证:Hugging Face、GitHub、PyPI 上的资源需要逐个确认 license,尤其是商业用途。
- 数据质量:命理类数据常有生成文本、重复文本、风格化解释,使用前需要抽样清洗。
- 确定性计算优先:八字和星盘应由算法计算,AI 负责解释,不负责直接计算。
- 避免绝对化表达:塔罗、星座、八字、MBTI 都更适合做娱乐、自我反思或咨询辅助,不应包装成医学、法律、投资或人生决策依据。
- RAG 优先于微调:在数据质量未验证前,建议先做 RAG 和提示词工程,不建议直接微调模型。
最小可行方案
如果要快速搭建一个 AI 分析助手,可以先按以下组合:
| 模块 | 推荐资源 | 处理方式 |
|---|---|---|
| 塔罗 | Blacik/tarot-card-meanings-78 | 转 JSON / 向量库 |
| 八字 | bazi 排盘算法库 + bazi-mingli 规则参考 | 程序排盘,AI 解读 |
| 星座 | Kerykeion | 程序算星盘,AI 解读 |
| MBTI | OpenJung + MBTIBench | 测评打分,AI 总结 |
| 综合语料 | divination-combined / tcm-divination-training | 清洗后做 RAG 或风格参考 |