每次高考加分政策一出来,评论区总是热闹的。
但这篇不讨论加分该不该有,只说一个具体的问题:申报了加分的考生提交的那些材料,是怎么被核查的。
加分材料包括哪些
不同省份规定不同,常见的加分材料大致分几类:
- 竞赛获奖证明(数学、物理、信息学等学科竞赛)
- 体育特长生相关证书
- 少数民族身份证明
- 烈士子女身份证明
这些材料通常是纸质证书的扫描件或拍照图片,上传到报名系统。
OCR做的第一层筛查
材料上传之后,系统会用OCR识别证书上的关键字段:颁发机构名称、获奖等级、证书编号、有效日期。
识别完之后,系统会拿这些字段跟官方数据库做比对。比如信息学竞赛的获奖,系统会查中国计算机学会(CCF)或省级组织机构的官方获奖名单,核对这个编号和姓名是不是真实存在的记录。
这一层是全自动的,速度快,能过滤掉大多数明显造假的材料(证书编号不存在、颁发机构名称有误等)。
但OCR有个明显局限
机器只认字,不认真假。
一张精心仿造的证书,如果证书编号真实存在(比如复制了别人的编号),OCR识别出来的结果和真实证书没有区别。
所以OCR只是第一关,后面还有人工核查。负责复核的工作人员会联系对应的颁奖机构,逐条核实。这一步完全是人工的,没有捷径。
公示环节的信息处理
通过初步审核的考生加分信息,会在官方渠道(教育局网站、学校公告栏)进行公示,接受社会监督。
公示的信息通常是表格格式,包含考生姓名、学校、加分项目、加分分值。
有意思的是,这份公示表格本身,往往是以PDF或图片形式发布的,不是可直接检索的文本。有些人会用OCR把这份表格转成可搜索的文字,方便查找和比对——这是OCR在这个场景里最反向的用法:识别的不是原始材料,而是官方发布的核查结果。
历史上出现过哪些问题
加分造假事件,大多数暴露在”信息比对”这一关——不是OCR识别出来的,而是数据库比对或者群众举报发现的。
有的案例是证书编号在官方系统里根本查不到;有的是获奖等级和公示名单上的不符;还有的是同一个证书编号出现在了多个考生的申报材料里。
后面这种情况,OCR其实能帮上忙——把所有上传的证书图像做OCR识别,再对识别出的编号字段做一次重复性检测,重复出现的编号就值得重点核查。这个思路在一些地方的系统里已经实现了。
说到底,OCR在加分核查里承担的是”提高效率”的角色,不是”保证公平”的保障。公平靠的是制度设计、信息公开和社会监督,不是机器。但效率工具用得好,能让造假的成本更高,这一点倒是实实在在的。