【校园AI Day-AI workshop】自定义区域识别重命名


该项目针对人工摘录图片指定区域信息效率低的问题,利用PaddleHUB的OCR技术,对30张交付验收单图片进行处理。通过识别文本、计算坐标最小欧式距离提取铁塔名称,实现文件重命名,正确率达93.3%,可提升实际工作效率。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

【校园ai day-ai workshop】自定义区域识别重命名 -

基于OCR的自定义区域识别文件重命名

一、项目背景

  • 在实际的工作中,有时候需要根据图片中的指定区域进行重命名,人工摘录工作效率低。
  • 利用飞桨的PaddleHUB可实现自主框选识别区,实现识别内容的精确提取,从而提高效率。

二、项目目标

  • 通过PaddleHUB技术识别图片中的铁塔名称,并根据该字段完成对图片的重命名。

三、数据集

  • 本任务提供30张交付验收单,来自 https://aistudio.baidu.com/aistudio/datasetdetail/142101

四、项目实现思路

  1. 整体思路:利用hub.Module.recognize_text获得OCR结果,在此基础上,通过计算最小距离,获得表单相关信息(铁塔实际名称),完成文件重命名。
  2. 对每张图片(每个表单)进行OCR识别,并将结果保存至ocr_result文件夹。
  3. 根据先验知识,获取所需内容(铁塔实际名称)的中心位置,记为目标坐标。
  4. 对某个图片(表单),遍历每条识别结果,计算其中心坐标,计算该坐标和目标坐标之间的欧式距离
  5. 获得最小欧式距离及其对应的文字识别结果
  6. 根据上述结果,重命名图片文件

五、项目代码实现

In [ ]
# 安装依赖包 !pip uninstall paddlehub -y
!pip install paddlehub shapely pyclipper
%env CUDA_VISIBLE_DEVICES=0%matplotlib inline
    In [ ]
#  解压数据集! unzip -q /home/aistudio/data/data142101/Scan_0012_0004.zip -d /home/aistudio/images
    In [ ]
# 导入需要的包import paddlehub as hub ,cv2,os,csv,globimport os
    In [ ]
# 项目实现for i in range(1,31):    # 遍历数据集图片
    # image_path:图片路径
    if i < 10:
        image_path = "images/Scan_0012_000" + str(i) + ".jpg"
    else:
        image_path = "images/Scan_0012_00" + str(i) + ".jpg"
    # print(image_path)

    # 利用hub.Module.recognize_text获得OCR结果,并保存图片至ocr_result文件夹,其中,
    # [cv2.imread(image_path) for image_path in glob.glob(image_path)] 用于读取图片并存入列表
    # use_gpu=True 使用GPU加速
    # output_dir 为输出结果路径
    form = hub.Module(name="chinese_ocr_db_crnn_server").recognize_text(\
    [cv2.imread(image_path) for image_path in glob.glob(image_path)],use_gpu=True, \
    output_dir='ocr_result', visualization=True, box_thresh=0.5, text_thresh=0.5)    # 初始化最小距离及对应的文本
    min_dis = 9999
    min_text = 'none'
    
    # 对OCR后的结果,即某份表单,遍历每条数据
    # 每条数据(form_data)包括识别后的文字text,置信度confidence,坐标等,项目涉及text和坐标
    for form_data in form[0]['data']:    
        # 初始化坐标中心
        data_x = 0
        data_y = 0

        # 注意数据格式:纵坐标在前,即每对坐标第一个值为y,第二个值为x
        for j in range(4):
            data_y += form_data["text_box_position"][j][0]
            data_x += form_data["text_box_position"][j][1]        # 计算四个坐标平均值,即为对应文本框坐标中心
        data_x = data_x / 4
        data_y = data_y / 4

        # 坐标中心离目标中心最近的数据为所需数据,暂定目标中心[220,1290]
        # 计算每条数据坐标中心距离目标的欧式距离
        distance = ((data_x - 220) ** 2 + (data_y - 1290) ** 2) ** 0.5

        # 如果距离小于最小距离,更新最小距离及对应文本
        if distance <= min_dis:
            min_dis = distance
            min_text = form_data["text"]    print(i,image_path,min_text)    # 打印结果
    
    # 重命名文件
    os.rename(image_path, "images/" + min_text + '.jpg')
   

六、项目结果展示

  • 解压缩数据集后,重命名前: 【校园AI Day-AI workshop】自定义区域识别重命名 -            
  • OCR识别结果 【校园AI Day-AI workshop】自定义区域识别重命名 -            
  • 重命名后 【校园AI Day-AI workshop】自定义区域识别重命名 -            

七、项目总结

项目通过PaddleHUB技术识别图片中的铁塔名称,并根据该字段完成对图片的重命名,正确率达到93.3%(28/30)。 项目能够将PaddleHUB技术落地,在实际的工作中根据图片指定区域,对文件进行重命名,提高工作效率。

Openflow Openflow

一键极速绘图,赋能行业工作流

Openflow 88 查看详情 Openflow

以上就是【校园AI Day-AI workshop】自定义区域识别重命名的详细内容,更多请关注其它相关文章!


# 营收  # 兵哥抖音seo  # 营销策略推广方法  # 商丘网站优化费用多少啊  # SEO战略分析皮肤  # 雪茄海淘网站知乎推广  # 秭归宜昌网站建设接单  # 宝安开发公司网站建设  # 北京企业抖音seo价格  # 鄂尔多斯营销推广公司招聘  # 公证关键词排名市场规模  # ai  # 值为  # 所需  # 遍历  # 每条  # 工作效率  # 表单  # 中文网  # 自定义  # 重命名  # udio 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 优化推广96088 】 【 技术知识133117 】 【 IDC资讯59369 】 【 网络运营7196 】 【 IT资讯61894


相关推荐: 智能机器人正在彻底改变客户服务  “长沙造”无人机,领先的不止植保  掌阅科技对话式AI应用“阅爱聊”开启内测  小米又拿下国际比赛第一:AI翻译立功  给小朋友最好的科技礼物:乐天派桌面机器人  2025 WAIC|美团无人机发布第四代新机型  出门问问亮相2025世界人工智能大会,展示AI CoPilot解决方案  爱设计PPT发布第二代AI一键生成PPT产品:智能、个性化、自动化  小米创始人雷军将揭示小米AI在年度演讲中的最新进展  华为4G5G通信物联网收费标准公布,多年研发成果,十年花费近万亿  复盘MWC上海:AI大模型时代到来 通信网络将会怎样改变?  苹果在韩举办首届中小企业智能制造论坛,加速推动工业4.0发展  如何提高集群协作效率?中外团队合作研发基于均值偏移的机器人队形控制策略  无需标注数据,「3D理解」进入多模态预训练时代!ULIP系列全面开源,刷新SOTA  “技术+实践+生态”三箭齐发,京东方抢占物联网高地  实现人工智能和物联网的协同运作  「模仿学习」只会套话?解释微调+130亿参数Orca:推理能力打平ChatGPT  云鲸发布全新的扫拖机器人J4系列  人工智能驱动智能建筑会是未来趋势吗?  华为余承东表示:鸿蒙可能拥有强大的人工智能大模型能力  人手一部「*」!视频版Midjourney免费可用,一句话秒生酷炫大片惊呆网友  美版贴吧8000小组自爆停摆!拒绝数据被谷歌OpenAI白嫖,CEO被网友骂翻:背刺第三方应用  特斯拉人形机器人将于 7 月亮相上海 2025 世界人工智能大会  新华全媒+|AI:当心,我可能欺骗了你!  微软为 AI 初学者推出免费网课:为期 12 周,共 24 节课  掌阅科技申请阅爱聊商标 掌阅科技申请AI相关商标  “木头姐”:特斯拉的人工智能训练——“赢家通吃”的机会  调查显示:实际上没有那么多人在用 ChatGPT  物联网和人工智能的协同作用:释放预测性维护的潜力  此「错」并非真的错:从四篇经典论文入手,理解Transformer架构图「错」在何处  机智云AI离线语音识别模组,让家电变得更加智能便捷  国内AI大模型“安卓时刻”到来!阿里云通义千问免费、开源、可商用  基于预训练模型的金融事件分析及应用  AI赋能艺术 超现实达利奇幻之旅在沪开启  AI技术改变*,新骗局来袭,*成功率接近100%  当孔子遇见AI|尼山的“数字”  【|直播|预告】人工智能高峰论坛将于7月2日13:30准时开播!  英伟达首席执行官黄仁勋:生成式 AI 时代「人类」会是新的编程语言  借助ChatGPT快速上手ElasticSearch dsl  找对了风口想不火都难,乐天派机器人,安卓机器人的最终形态?  马斯克嘲讽人工智能:机器学习本质就是统计学  利用AI探索抗体“钥匙”、加速药物研发——访百图生科团队  对艺术家拒绝置若罔闻,Stability AI 将推出适应多种画风的开源模型  学生作文评分的新趋势:教师与AI的合作模式  原小米 9 号员工李明打造全球首款 AI 安卓桌面机器人  无人机协助盐城交通执法的协同训练  日本学校探索引入 AI 和无人机:提高安保效率,节省劳动力  机器人加速!稀土永磁也被带火,持续性如何?  AI在教育中的角色:AI如何改变我们的学习方式  华为推出全新操作系统HarmonyOS 4,AI和新引擎完美融合 

 2025-07-30

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

运城市盐湖区信雨科技有限公司


运城市盐湖区信雨科技有限公司

运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。

 8156699

 13765294890

 8156699@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.