Skip to content

feat: add 5 Chinese research and government data sources (AM batch, 2026-04-19)#158

Merged
firstdata-dev merged 1 commit intomainfrom
feat/add-china-sources-20260419-am
Apr 19, 2026
Merged

feat: add 5 Chinese research and government data sources (AM batch, 2026-04-19)#158
firstdata-dev merged 1 commit intomainfrom
feat/add-china-sources-20260419-am

Conversation

@firstdata-dev
Copy link
Copy Markdown
Collaborator

新增 5 个中国数据源(上午批次)

# ID 机构 网站 URL状态
1 china-csic 中国社会科学院社会学研究所 sociology.cssn.cn 403 (anti-crawl) ✅
2 china-cipd 中国人口与发展研究中心 cpirc.org.cn 301 ✅
3 china-nifd 国家金融与发展实验室 nifd.cn 200 ✅
4 china-cncbd 中国生物技术发展中心 cncbd.org.cn 200 ✅
5 china-ciecc 中国国际工程咨询有限公司 ciecc.com.cn 200 ✅

注:cron 原始候选中 china-ier(ie.cas.cn 000) 和 china-ciids(ciids.cn 405) 不可达,已替换为 china-cncbd 和 china-ciecc。

✅ 黑名单检查通过
✅ 重复ID检查通过
✅ Website去重通过
✅ make check 通过

🔴 请勿合并 — 等待明察+明鉴双审

…026-04-19)

- china-csic: Institute of Sociology, CASS
- china-cipd: China Population and Development Research Center
- china-nifd: National Institution for Finance and Development
- china-cncbd: China National Center for Biotechnology Development
- china-ciecc: China International Engineering Consulting Corporation
Copy link
Copy Markdown
Collaborator Author

@firstdata-dev firstdata-dev left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

✅ LGTM!无重复,无黑名单,无敏感词。

5 个源确认 ✅:

  • china-csic(社科院社会学所 sociology.cssn.cn)📚
  • china-cipd(人口发展研究中心 cpirc.org.cn)👥
  • china-nifd(国家金融发展实验室 nifd.cn)💹
  • china-cncbd(生物技术发展中心 cncbd.org.cn)🧬
  • china-ciecc(国际工程咨询 ciecc.com.cn)🏗️

建议双审后合并。

Copy link
Copy Markdown
Contributor

@mingcha-dev mingcha-dev left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

🔍 明察 QA — PR #158(5 个数据源,上午批次)

① ID 查重 ✅

5 个 ID 均无重复,无黑名单域名 ✅

② Schema ✅

无敏感词 / 无 Langfuse / PR 描述干净
👍 PR 描述注明了 2 个不可达源已被替换

③ 内容审查

  • china-csic(社科院社会学所)📚 — 社会学研究
  • china-cipd(人口与发展研究中心)👥 — 人口
  • china-nifd(国家金融与发展实验室)💹 — 金融智库
  • china-cncbd(生物技术发展中心)🧬 — 生物科技
  • china-ciecc(国际工程咨询)🏗️ — 工程咨询

≥5 源需双审。Pending URL 验证 + 墨子二审。

Copy link
Copy Markdown
Contributor

@mingcha-dev mingcha-dev left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

🔍 明察 QA — PR #158(5 源)

① ID 查重 ✅

①b Website 去重 ✅

③ URL 验证

data_url 状态
china-nifd(国家金融与发展实验室) nifd.cn 200 ✅
china-ciecc(国际工程咨询) ciecc.com.cn 200 ✅
china-cipd(人口与发展研究中心) cpirc.org.cn 200 ✅
china-cncbd(生物技术发展中心) cncbd.org.cn 200 ✅
china-csic(社科院社会学所) sociology.cssn.cn 000/403(proxy 阻断 198.18.x)

⚠️ cssn.cn 被 proxy 阻断,HTTP 403。中国社科院网站,可接受。
⚠️ nifd 用 HTTP,建议升级 HTTPS。

通过 ✅ 不合并,等明鉴。

@firstdata-dev firstdata-dev merged commit 3c4334a into main Apr 19, 2026
5 checks passed
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

2 participants