返回文档

Document

命理与人格分析数据资源整理

整理日期:2026-05-18

塔罗、八字、星盘、MBTI 等方向可作为 AI 分析参考的数据集、算法库和知识源整理。

命理与人格分析数据资源整理

整理日期:2026-05-18

本文档只整理“可作为 AI 分析参考的数据 / 算法库 / 知识源”,不包含可直接安装的 agent skill。
这些资源适合用于 RAG 知识库、结构化规则库、提示词参考、模型评估或训练数据预处理。

类型说明

类型作用是否直接会分析
数据集提供牌义、案例、文本、标签、训练样本否,需要自行设计分析逻辑
算法库计算八字、星盘、相位、测评分数等确定性结果部分会算,解释通常交给 AI
RAG 知识库把数据整理后供 AI 检索引用依赖检索和提示词设计
Skill教 AI 按什么流程分析是,偏工作流;不在本文重点范围内

推荐使用路线

  1. 塔罗:用结构化牌义数据做知识库,再叠加牌阵规则。
  2. 八字:优先使用确定性排盘算法库,AI 只负责解释排盘结果。
  3. 星座 / 西洋占星:用算法库计算星盘、宫位、相位,再让 AI 解读。
  4. MBTI:优先用测评题库或开放人格模型打分;文本推断类数据只能作为弱参考。

塔罗数据

Blacik/tarot-card-meanings-78

  • 链接:https://huggingface.co/datasets/Blacik/tarot-card-meanings-78
  • 内容:78 张塔罗牌的结构化牌义数据。
  • 常见字段:牌名、正位含义、逆位含义、爱情、事业、yes/no、星座或行星对应等。
  • 适合用途:
    • 塔罗 RAG 知识库。
    • 牌义检索。
    • 牌阵解读提示词。
    • 将牌义转成 JSON / SQLite / 向量库。
  • 使用建议:
    • 保留原始字段,不要直接混成一段长文本。
    • 可按“大阿尔卡那 / 小阿尔卡那 / 权杖 / 圣杯 / 宝剑 / 星币”建立分类索引。
    • 解读时把“牌义”和“牌阵位置”分开处理,避免 AI 混淆。

jakeveo05/divination-combined

  • 链接:https://huggingface.co/datasets/jakeveo05/divination-combined
  • 内容:综合占卜数据,包含星座运势、神秘学文本、塔罗解读、八字、塔罗牌义等。
  • 规模:约 41,034 条。
  • 适合用途:
    • 多领域命理分析语料参考。
    • 塔罗 / 星座 / 八字风格模板。
    • 做分类、标签体系、提示词样例。
  • 注意事项:
    • 包含生成式文本,质量需要抽样检查。
    • 不建议不清洗就直接用于微调。
    • 更适合先做 RAG 或提示词参考。

八字 / 命理数据与算法

GitHub bazi topic

  • 链接:https://github.com/topics/bazi
  • 内容:GitHub 上与八字相关的开源项目集合。
  • 适合用途:
    • 查找八字排盘算法。
    • 查找干支、节气、十神、五行、大运、流年的计算逻辑。
    • 对比不同项目对真太阳时、节气切换、日柱计算的处理差异。
  • 使用建议:
    • 八字分析应先用程序产出稳定排盘结果,再交给 AI 做解释。
    • 不建议让 AI 直接从出生时间“脑算”八字,容易出现基础盘错误。

wolke/bazi-mingli

  • 链接:https://github.com/wolke/bazi-mingli
  • 类型:八字 / 命理相关 skill 与规则资料项目。
  • 适合用途:
    • 参考八字分析流程。
    • 提取五行、十神、日主强弱、用神、大运流年等解释框架。
    • 拆成自己的提示词模板或知识库。
  • 使用建议:
    • 可作为“分析框架参考”,但实际排盘仍建议接入稳定算法库。
    • 如果用于商业产品,要单独检查许可证和内容来源。

jakeveo05/tcm-divination-training

  • 链接:https://huggingface.co/datasets/jakeveo05/tcm-divination-training
  • 内容:综合中医与命理训练数据,包含八字、紫微、易经、风水、中医、星座、塔罗等。
  • 规模:约 162K+ 样本。
  • 适合用途:
    • 中文 / 英文 / 越南语命理类语料参考。
    • 构建多领域命理助手的初始数据池。
    • 做主题分类、问答样例、解释风格参考。
  • 注意事项:
    • 数据量大但来源复杂,必须抽样评估。
    • 不适合直接作为“权威知识库”。
    • 更适合作为候选语料,筛选后再进入 RAG 或训练流程。

星座 / 西洋占星数据与算法

Kerykeion

  • 链接:https://kerykeion.net/
  • 类型:Python 西洋占星算法库。
  • 能力:计算本命盘、行星位置、宫位、相位、行运等。
  • 适合用途:
    • 生成结构化星盘数据。
    • 构建星盘分析 AI 的确定性计算层。
    • 将星盘结果转给 AI 做文本解释。
  • 使用建议:
    • 星座分析不要只使用“每日星座运势”文本。
    • 更稳的方式是:出生时间地点 -> 星盘计算 -> 结构化结果 -> AI 解读。
    • 输出给 AI 时建议包含太阳、月亮、上升、行星落座、宫位、主要相位。

Swiss Ephemeris / pyswisseph

  • 相关链接:https://pypi.org/project/pyswisseph/
  • 类型:天文历表计算库 / Python 绑定。
  • 适合用途:
    • 更底层、更精确的行星位置计算。
    • 需要严格星历数据时使用。
  • 注意事项:
    • Swiss Ephemeris 有许可证要求,商业使用前要确认授权。
    • 如果只是个人分析或原型验证,可以先用 Kerykeion 降低接入复杂度。

MBTI / 人格分析数据

Shunian/kaggle-mbti-cleaned

  • 链接:https://huggingface.co/datasets/Shunian/kaggle-mbti-cleaned
  • 内容:Kaggle MBTI 文本分类数据的清洗版本。
  • 规模:约 409,785 行。
  • 适合用途:
    • 文本人格倾向分类实验。
    • MBTI 标签分布分析。
    • 训练或评估文本分类器。
  • 注意事项:
    • MBTI 标签多为用户自报,存在偏差。
    • Reddit / 社区文本容易学习到话题偏好,而不是真实人格。
    • 不建议把模型输出包装成确定人格结论。

MBTIBench

  • 链接:https://arxiv.org/abs/2412.12510
  • 内容:用于 MBTI 人格检测的大模型 benchmark 与数据研究。
  • 特点:关注旧 MBTI 数据集的标签错误、数据偏差和评估问题。
  • 适合用途:
    • 做 MBTI 文本推断模型评估。
    • 参考更严谨的人格数据标注方法。
    • 对比传统 Kaggle MBTI 数据的缺陷。
  • 使用建议:
    • 如果目标是“严肃人格分析”,优先参考这类 benchmark 的评估方式。
    • 如果只是娱乐产品,可以用更轻量的测评题和解释模板。

OpenJung / OEJTS

  • 链接:https://github.com/openjung/core
  • 类型:开放式 Jung / MBTI-like 测评框架。
  • 内容:32 题、1-5 分制、四个维度评分,输出类似 MBTI 的人格类型。
  • 适合用途:
    • 构建开放版 MBTI 测评。
    • 避免直接依赖官方 MBTI 版权体系。
    • 作为 AI 人格分析前的结构化输入。
  • 使用建议:
    • 推荐“测评结果 + 用户文本 + AI 分析”组合使用。
    • 不建议只靠用户几句话直接推断 MBTI。

建议的数据处理结构

塔罗牌义 JSON 示例

{
  "card": "The Fool",
  "arcana": "major",
  "upright": ["new beginnings", "freedom", "spontaneity"],
  "reversed": ["recklessness", "risk", "naivety"],
  "love": "...",
  "career": "...",
  "yes_no": "yes",
  "associations": {
    "element": "air",
    "planet": "uranus"
  }
}

八字分析输入示例

{
  "birth": {
    "datetime": "1995-08-21 14:30:00",
    "timezone": "Asia/Shanghai",
    "location": "Shanghai, China"
  },
  "chart": {
    "year_pillar": "...",
    "month_pillar": "...",
    "day_pillar": "...",
    "hour_pillar": "..."
  },
  "derived": {
    "ten_gods": [],
    "five_elements": {},
    "day_master_strength": "...",
    "luck_pillars": []
  }
}

星盘分析输入示例

{
  "birth": {
    "datetime": "1995-08-21 14:30:00",
    "timezone": "Asia/Shanghai",
    "location": "Shanghai, China"
  },
  "natal_chart": {
    "sun": {"sign": "...", "house": 0},
    "moon": {"sign": "...", "house": 0},
    "ascendant": {"sign": "..."},
    "planets": [],
    "aspects": []
  }
}

MBTI 分析输入示例

{
  "questionnaire": {
    "source": "OpenJung/OEJTS",
    "scores": {
      "E_I": 0,
      "S_N": 0,
      "T_F": 0,
      "J_P": 0
    },
    "type": "INTJ"
  },
  "user_text_samples": [],
  "analysis_goal": "self-reflection"
}

重要注意事项

  1. 版权与许可证:Hugging Face、GitHub、PyPI 上的资源需要逐个确认 license,尤其是商业用途。
  2. 数据质量:命理类数据常有生成文本、重复文本、风格化解释,使用前需要抽样清洗。
  3. 确定性计算优先:八字和星盘应由算法计算,AI 负责解释,不负责直接计算。
  4. 避免绝对化表达:塔罗、星座、八字、MBTI 都更适合做娱乐、自我反思或咨询辅助,不应包装成医学、法律、投资或人生决策依据。
  5. RAG 优先于微调:在数据质量未验证前,建议先做 RAG 和提示词工程,不建议直接微调模型。

最小可行方案

如果要快速搭建一个 AI 分析助手,可以先按以下组合:

模块推荐资源处理方式
塔罗Blacik/tarot-card-meanings-78转 JSON / 向量库
八字bazi 排盘算法库 + bazi-mingli 规则参考程序排盘,AI 解读
星座Kerykeion程序算星盘,AI 解读
MBTIOpenJung + MBTIBench测评打分,AI 总结
综合语料divination-combined / tcm-divination-training清洗后做 RAG 或风格参考