news 2026/5/26 5:56:27

无限泛化!AI背景文字识别,腾讯文字六宫格

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
无限泛化!AI背景文字识别,腾讯文字六宫格

注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路
如有侵犯,请联系作者下架

本文识别已同步上线至OCR识别网站: http://yxlocr.nat300.top/ocr/textclick/12

之前写过一篇水文,腾讯包含文字验证码,但是由于腾讯的AI背景越来越多越来越杂,文字越来越变态,并且标题种类也在增加,成语,同音字等等。。。

过程介绍

      • 训练介绍
      • 生成过程
      • 结尾

训练介绍

仅靠手里那小十几万,几十万数据集是远远不够的,并且此类场景只能做二阶段,但凡做一阶段,那就是XX,根本适应不了后续的更新,二阶段,还想要无限泛化,靠人工标注肯定是不够的,你的成本无限上升,那么本篇文章还是自己去生成,自给自足才能恒久远,最终效果可以到网站上测试下,当然,再好的模型也不会有百分百的准确率的,各位伙伴自己随机尝试即可,注意,网站目前只支持输入文字,判断文字所在的位置,暂不开放适配成语、同音字这样的类型,需要该类型可以单独找我

生成过程

首先就是选型,字体类型、背景类型、形变类型都要确保充足覆盖,这里我使用了上百种字体,2w+的字库,首先确保无论是常用字还是生僻字,都能覆盖全面

背景的选型就不是很讲究了,只要你的背景数量够多够杂,每次随机背景中的一块区域,基本上你的背景也能做到很随机了,甚至你拿其他验证码图片作为背景都可以,以下这种都可以,

这里使用pillow生成文字,代码层面,只需要做到在随机选取背景和文字的情况下,也能随机应用形态学,这里我使用了数十种图像增强,部分代码如下:

其中,部分生成数据集如下,从简单背景到复杂背景,从简单形变到复杂形变,均有生成,其中部分生僻字,经过图像增强后,也许看不清,但这并不影响模型的训练数据集总数达2000W+

在有了大量数据集后,训练就是一个简单的事情了,如果你的模型选型就比较大,比方说resnet101这种,训练都要个把礼拜了,总之,准备好gpu和合适的模型选型,开练吧!

结尾

通过该方法训练的模型后,并不只适用于腾讯,普通文字点选,生僻字识别等等都有很高的准确率,通过测试,该模型对字的字体、形态、形变、角度等都训练到了不错的效果,基本上可以做到通用了,下面是适配的文字识别,能适配但不限于



即便是咸鱼这种变态文字也能覆盖

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/26 5:53:00

【AI编程】Qoder Cli实现开源应用一键部署

使用 Qoder CLI实现开源应用一键部署 Agent 的实战分享 开场:Agent 开发的三种模式 在开发 AI Agent 时,通常有三种常见模式: 高代码模式:从零开始手动编写,亲自对接大模型、编写工具。可选使用框架如 LangChain、La…

作者头像 李华
网站建设 2026/5/26 5:53:38

毕设项目 基于协同过滤的商品推荐系统

简介 推荐系统,是当今互联网背后的无名英雄。 我们在某宝首页看见的商品,某条上读到的新闻,某度上的搜索列表,甚至在各种地方看见的广告,都有赖于推荐算法和系统. 本片文章讲述有哪些常用的推荐算法, 协同过滤推荐算法…

作者头像 李华
网站建设 2026/5/26 6:14:25

如何运用巴菲特的智慧进行投资

如何运用巴菲特的智慧进行投资关键词:巴菲特、投资智慧、价值投资、长期投资、安全边际、财务分析、企业护城河摘要:本文旨在深入探讨如何运用巴菲特的投资智慧进行投资。从介绍巴菲特投资理念的背景出发,详细阐述其核心概念,包括…

作者头像 李华
网站建设 2026/5/26 6:14:30

AutoGPT + Token服务 构建可持续运行的AI智能体

AutoGPT 与 Token 管理:构建可持续运行的 AI 智能体 在企业自动化需求日益增长的今天,一个典型的问题反复浮现:如何让 AI 不只是回答问题,而是真正“把事情做完”?我们不再满足于每次点击都需手动输入指令的聊天机器人…

作者头像 李华
网站建设 2026/5/26 7:18:32

力扣--262. 行程和用户(数据库题目)

前言: 这个力扣数据库题单里面的一道题,当时看文字很多,直接看的案例,一开始没什么思路,对CASE WHEN函数接触确实少,一开始没下起来! 题目: 表:Trips ----------------------- |…

作者头像 李华
网站建设 2026/5/25 12:01:52

手把手教你部署LobeChat镜像,打造个性化AI助手门户

手把手教你部署LobeChat镜像,打造个性化AI助手门户 在大模型技术席卷全球的今天,越来越多用户不再满足于使用封闭的商业AI聊天工具。虽然像ChatGPT这样的产品体验出色,但数据隐私、高昂成本和功能受限等问题始终是悬在头顶的达摩克利斯之剑。…

作者头像 李华