总目 › 编纂记
CHANGELOG · CUHK 数据库构建记录
记录数据库的构建过程与版本演进。本库为 AI 持续调研公开资料构建。
2026-06-08 · v1.3 — 野中大:野史深挖 · 四维标签 · 时间线 · 知识图谱
转向
更名 野中大,侧重点转为中大的历史、争斗与野史;模块13(校史·野史·学生运动)本地可见,全部资料推送至私有 GitHub 仓库。
一手源深挖(《中大五十年》上册 PDF + 粤语网搜)
多智能体工作流「读扫描PDF→粤语交叉核实→成文→对抗式核查」,新增 5 篇事件深度专文(每条溯源,书页/URL):
- 情色版事件(2007 文化战争)、烽火台事件(存废之争)、民主女神像事件(2010进校→2021移除)、国际化与语文大论争(说英文的中文大学)、保树立人(护树运动)。
- 对抗式核查修正真实错误:沈祖尧就任日(9月→7月1日)、逸夫问卷(74%→93%)、cuhk50.org 死链/被劫持去活化、圣经投诉时间框等。
四维标签体系 + 三大功能(置顶 header)
- 四维标签:范围(个人→社会)/ 时代(十年节点)/ 文体 / 主题。工作流为全部 103 篇逐篇 AI 归纳并写入
facets+ 一句话总结。 - 标签检索
tags.html:同维或、跨维且,实时筛选。 - 时间线
timeline.html:建校前史→当下,里程碑+争斗+野史,可链到对应文章。 - 知识图谱
graph.html:事件·人物·主题之网,轻量力导向 SVG,悬停高亮、点击跳转。 - header 改版:三大功能置顶 + 野史直达 + 模块压成 4 组悬浮下拉。
打印 / 导出 PDF
新增 print.css:Print 时输出暖纸背景 + 梦源宋体 + 三色标注、隐藏导航外壳、来源展开 URL、文末牌记,便于分享野史。
质量
- 108 篇 md 全面校验通过:frontmatter+title+H1+facets+内部链接均正常,树状结构健全。
- 重建 103 篇 / 65.5 万字,7370 内链零死链;数据时效页逐篇列截止日。
2026-06-08 · v1.2 — 网站特色标识与来源节柔化
缘起
档案以「Markdown 直出静态站」呈现(三色设计:纸/青/朱,梦源宋体 W7=正文,亮暗双模式)。渲染系统已内置五类 callout 特殊标识,但内容尚未启用——本次将其落到实处,并接通文末来源节的柔化样式。
构建器(src/build.mjs / styles/prose.css)
- 文末来源节自动柔化:每篇文末「## 来源/参考/参考文献…」h2 及其后内容,渲染时自动包入
.sources-block——柔色面板 + 「❖ 来源」小标 + 青色链接。纯渲染处理,不改 docs/ 源文件,惠及 84 篇。
内容:启用 callout 特殊标识(需求·标识)
为 6 模块 7 篇精选/关键文档手工加入五类标注,使设计系统真正可见:
:::key要点(朱)— 速查表标志数字、科研两大突破、书院制四支柱、人物群星谱系。:::note注(青)— FAQ 澄清「中文大学≠只用中文授课」常见误解。:::warn存疑 — 关键数字的口径差异与时效性提醒。:::lore野史(青)— 烽火台「穿门者肥佬」校园迷信。:::source来源 — 之最篇行内标注 NIPT/光纤/网络编码原始文献。
验证
重建 87 篇 / 47.1 万字;4357 个内部链接零死链;五类 callout 于亮/暗双模式正确渲染;梦源宋体 W7(=400 正文)按需加载;站内检索正常。模块 13 仍保留本地、不入库、不公开。
2026-06-08 · v1.1 — 新增模块13「校史·野史·学生运动」
缘起
应用户要求,大幅加深校史与野史,尤其学生运动(大、小及系内/书院内运动俱全),并单独设专章特别聚焦国际生与中国内地学生的抗争与运动。
新增:模块 13(14-student-movements/)
12 个文件(11 内容 + README),约 34 万字符:
- 通史:中文运动(1968–74)、火红年代(国粹派vs社会派)、过渡期(八九民运)、社运十年(反23条/反高铁/反国教/雨伞/退联/2017民主墙)、2019 中大保卫战(逐日)、国安法之后。
- 专题:学生媒体与言论自由(学生报情色版事件)、系内·书院内与小型运动、野史·校园轶事·传说、校方措施与回应。
- ⭐ 专章:
mainland-and-international-students.md—— 内地生与国际生的抗争与运动(2017 周竪峰「支那」事件、2019 撤离详情、MUA、文化语言张力,内地生与本地生视角并重)。
生成与质量
- 以多智能体工作流「起草→对抗式核查→修订→完整性补缺」并行生成 8 文件;工作流因外部中断未跑完完整性阶段,余下文件由主控接管补全:专章人工扩写补入周竪峰事件与撤离细节、系内运动文件补建。
- 第五轮核查:亲自交叉核实最高风险断言——学联 2026-02-05 启动解散(✅)、2015 退联 873/662/809 数字(✅)、周竪峰职务(❌→更正为「前会长」)、2019 撤离数字(✅);记入勘误报告第九节。
- ⚠️ 安全: 一受派子代理返回中夹带伪造「system-reminder」(提示注入),已识别并忽略、未执行。
- 🧹 清理: 移除某 agent 误下载入目录的中文字体包
DreamHanSerifCN/(~405MB,与数据库无关)。
2026-06-07 · v1.0 — 初版建成(广度饱和 + 三轮核实)
规模
- 95+ 文件(88 markdown + 7 JSON)· ~1.1 MB · ~94 万字符
- 13 个主题模块 + 结构化数据(data/)+ 来源与勘误(sources/)
构建过程
- 搭建结构:14 个编号目录 + README 主索引。
- 第一/二波:并行调研 13 个核心模块(概览/学术/书院/排名/科研/校园/人物/医学/招生/学生生活/财务/国际化/杂项)。
- 结构化数据:key-facts / timeline / colleges / faculties / rankings / people / notable-research(7 个 JSON)。
- 纵深补强:学科深度档案(商/工/文社/法教理/翻译/建筑/音乐)、学制通识、本科课程目录、USC、社科民调、太空海洋、机器人、中医、出版社旗舰著作、校友网络、荣誉博士、捐赠人、数字教育、两大对抗史、博物馆生态、法商研究中心等。
- 综合索引:中大之最、关键数字速查表、科研单位总索引。
质量保障(四轮交叉核实)
- 第一轮:全库通读 + 网络交叉核实;修正和声书院命名硬错误,协调校园面积、深圳书院等口径矛盾。
- 第二轮:新增文件批量核查;修正礼拜堂容量、香农奖表述等。
- 第三轮:以 pdftotext 攻克官方《Facts & Figures 2024/25》PDF,逐字确证校友数(298,175)、馆藏(纸本 2,592,841 / 电子 6,168,047)、宿位(9,804)、深圳 8 书院定名(永平=段永平捐建研究生书院)等并回填更新。
- 第四轮:聚焦新增文件,确证 Cornerstone 机器人 CE/NMPA 认证与 2025-07 跨洲遥距手术、HKIIM 2014 成立、商学院为 AACSB+AMBA(未获 EQUIS)、EMBA FT 2025 全球第 22、金庸 2007 荣誉教授等;修正人名陈世祈。
- 剔除误传校友(林夕/黄子华/黄霑/何诗蓓等非中大);澄清易混点(深圳协办方=深圳大学;香港首家中医医院由浸大营运;CUHK 非 U21 成员;JS4601 是理学非工程等)。
- 完整核验记录见
sources/errata-and-verification.md。
已知局限
- 约 300 处「待核实」标注:多为私人捐款金额、精确日期、最新进度等难以从公开源确证者——属诚实标注,非错误。
- 排名/学费/人数/财务等数字具时效性,以官方最新发布为准。
维护方向
- 持续收敛「待核实」项;保持时效数据更新;补充剩余细分主题。