项目 内容
课程 2020春季计算机学院软件工程(罗杰 任健)
作业要求 团队项目选择

项目名称

FOTT

项目内容

在OCR-Form-Tools开源项目的基础上,扩展功能,支持演示更多的API,例如看本账户有多少个模型;支持更多的应用场景,例如生成支持编程小白直接运行的python代码,只要提供endpoint和app key即可直接开始运行极大地简化上手难度和编程操作等。

Need

​ 对于各类有大量表单数据录入的企业或机构而言,如何实现大量纸质表单的快速智能电子化非常重要,针对票据表单的OCR表格识别技术在表格数据采集和应用之间架起高速通道。本项目可以节省大量的数据录入工作量、大大加快数据录入的效率、提高数据录入的准确性、并实现大量纸质表单原图的安全保存,能够满足各行各业的需求,让公司的业务摆脱手工。并且现在OCR的市场已经比较成熟,比如银行、保险、金融、税务、海关、公安、边检、物流、电信工商管理、图书馆、户籍管理、审计等很多行业都已经应用了OCR技术。而OCR-Form-Tools开源项目的在线工具部署在Azure上,国内访问比较困难,其他方法需要较高的计算机能力,因此我们的项目对没有较强计算机能力或网络环境的文字编辑非常友好。

Approach

项目基于微软的OCR Form Labeling Tool,将其他的功能开发成可视化程序,主要从两个角度开发:

  • 基于微软FOTT的API接口,扩展功能,完善当前的Web应用

    ​ 因为原应用是一个React + Redux Web应用,使用TypeScript语言(是JavaScript的超集,最终会被编译为JavaScript代码)开发 ,这也是我们进行扩展开发所使用的技术;

  • 基于已有的逻辑生成Python代码,便于开发者调试和测试

    ​ 技术基于React和TypeScript。

因为我们组大部分队员都很少有大型项目开发的经验。这次能够基于微软开源的项目的进行功能开发和完善是一个很好的平台,也是很大的挑战;我们也有很多需要学习的新知识和理论,并且在不算充足的时间里应用于实践,大概也能让我们很好的体会"敏捷开发"。在实践开发过程中,肯定会面临很多困难,但是作为一个团队前进,大家也一定会交流探讨,互帮互助,各司其职;再加上课程组和微软高级工程师专业的指导,大概也会是approach的buff加持。

Benefit

  • 容易上手、操作简单,不需要较高的编程能力或专业知识背景;
  • 文本分割粒度细,正确率较高;对手写字体也识别精准;
  • 用户可以手动更改各种表单训练集,标记tag再训练模型,可选取任意信息输出,实现重要信息的识别提取和不重要信息的过滤;
  • 功能丰富、形式多样,支持表格、收据等多种API;格式支持广泛,常见的图片、pdf均可;

Competitor

现在市面上有多种OCR识别软件、但这种专门是针对表单的OCR项目却并不多见。

睿琪票据智能识别平台为例,只提供了发票、火车票等相关功能,不能实现任意表单的任意数据的提取。

同时,我们的项目能够实现让没有多少编程经验的人放心使用,而市面上的大多数工具只是提供了一个API接口,具体代码需要自己实现,对没有编程能力的使用者非常不友好。

Delivery

  • 主要网站上线,参考:https://fott.azurewebsites.net/
  • 源码:github(支持本地编译按照使用,需要一定的计算机知识,提供教程也是不错的选择)
  • 前期主要考虑在同学、老师中宣传,搜集初步的应用反馈(调查问卷等);后期可以考虑通过知乎、公众号等进行推广。

用户量评估

发布一周,预估用户量400。

要点组合

各位领导/合作伙伴: 我们的 OCR功能增量开发以及API的完善是为了解决个人和企业面对大量表单数据以及OCR工具上手不易的痛苦, 他们需要获取各类表单(pdf、卡证、票据等)的数据进行自动识别、信息抽取、审核、对比等, 但是现有的方案并没有很好地解决这些需求,我们有现已较成熟的基于React和TypeScript的技术来支持相应功能的实现, 它能给用户带来易上手、个性化可定制、精准识别、功能完善的使用体验, 远远超过竞争对手 天若OCR睿琪票据智能识别平台等,包括我们以前的版本。我们相信新的改进能给我们带来更多用户以及落地的实用性改善,甚至应用于商业领域。值得期待。

参考博客

NABCD-name not found的更多相关文章

  1. 利用NABCD模型进行竞争性需求分析

    微博的NABCD模型 N-Need:毫无疑问,当今的中国普通民众是有这点需求的,在上个世纪中国民众的休闲娱乐方式更多的停留在以电视传媒为主的娱乐方式,而进入21世纪以来中国民众的娱乐中心向互联网转移, ...

  2. [课程设计]Scrum 1.1 NABCD模型&产品Backlog

    多鱼点餐系统WEB NABCD模型 & 产品Backlog ● 一.NABCD模型  1) N (Need 需求) 为了解决餐饮企业在同行中的竞争优势,减少顾客到店后的点餐.等餐及结算过程消耗 ...

  3. PhyLab2.0需求与功能分析改进文档(NABCD)

    PhyLab1.0需求规格说明文档 1. 概述 1.1 项目概述 软剑攻城队小组于2015学年开发了PhyLab物理实验网站,一经发布好评如潮.网站的核心功能是提供预习报告和自动数据处理,而后加入了论 ...

  4. 团队项目作业:利用NABCD模型进行竞争性需求分析

    NABC正是这样的一套框架,当你试图提出一项崭新的提案之际,它能够提供四个思维基点,令你的商业策划具备天马行空的基础. 具体来说,NABC是四个关键词的首字母缩写- Need(需求)-现在市场上未被满 ...

  5. NABCD需求分析

    1. N 需求    如今的社会,每个公司每个人都有大量的信息需要处理.保管和查询,这就难免会有些信息在个人电脑中保存的位置被遗忘,需要一款简单并且实用的搜索引擎来搜索个人 所需求的信息. 2. A ...

  6. 饭团(1):用NABCD大法为项目奠基

    上一篇文章:提升效率的开发工具 提到高效的开发工具就像催化剂,加速项目开发.这篇文章提到的NABCD大法,就像一份地图,指引项目往正确的方法上发展. 选择比努力更重要.一个项目成功自然离不开码农们的努 ...

  7. NABCD——竞争性需求分析的框架

    最近在读邹欣老师的书<构建之法>,读到很多地方,相当有感触,有种一拍大腿“啊,他说的太对了”的感觉,但都疏于记录,今天又看到一个一拍大腿特带感的一节,决定记录下来. 竞争性需求分析的框架— ...

  8. 思甜雅--关于qq的NABCD模型分析

    个人连接:http://www.cnblogs.com/xiaoliulang/ 关于QQ的NABCD模型 N--Need 随着电脑的普及,人们在网络上进行交流的时间越来越多,由于现有的交流工具还不是 ...

  9. 团队项目NABCD模型的需求分析

    团队项目NABCD模型的需求分析 NABCD模型的介绍 Need(需求)-现在市场上未被满足但又急需满足的客户需求是什么?Approach(方法)-要满足这种需求,我能够提出什么独特的方法吗?Bene ...

  10. 团队项目作业第二项:利用NABCD模型进行竞争性需求分析

    项目需求分析与建议--NABCD模型(王鲁跃负责) N (Need 需求) 对于现在的学生来说,我们认为打字是很重要的.不管在什么方面都需要进行电脑打字,例如文员.QQ.MSN.制作,论文等等,都需要 ...

随机推荐

  1. [set]JZOJ 5821 手机信号

    Description

  2. 回忆那些年我玩过的ide,看看哪些你也玩过,看图回忆

    闲来无聊,回忆一下这些年玩过的ide.看看哪些你也玩过. QBasic 第一个ide,兴奋程度也是最大的,从此进入了码农行列 VisualBasic 可以拖界面了,成就感爆棚 Turbo C c语言, ...

  3. 尝试做一个.NET简单、高效、避免OOM的Excel工具

    Github : https://github.com/shps951023/MiniExcel 简介 我尝试做一个.NET简单.高效.避免OOM的Excel工具 目前主流框架大多将资料全载入到记忆体 ...

  4. [Kick Start] 2021 Round A

    题目:2021 Round-A . K-Goodness String 签到题,计算当前字符串的 K-Goodness Score ,然后与给出的 K 做差即可. #include <iostr ...

  5. 扩展中国剩余定理(EXCRT)学习笔记

    扩展中国剩余定理(EXCRT)学习笔记 用途 求解同余方程组 \(\begin{cases}x\equiv c_{1}\left( mod\ m_{1}\right) \\ x\equiv c_{2} ...

  6. 关于 Spring 中 getBean 的全流程源码解析

    作者:小傅哥 博客:https://bugstack.cn 沉淀.分享.成长,让自己和他人都能有所收获! 一.前言 你提出问题,就要给出解决方案! 最近有粉丝小伙伴反馈,与自己的上级沟通总是遇到障碍, ...

  7. kubernetes 查看cpu,内存使用情况

    kubectl top pod --all-namespaces kubectl top pod -n kubeflow

  8. React/Vue里的key到底有什么用?看完这篇你就知道了!(附demo代码)

    网上有很多博客讲到,React.Vue里的key,与 Virtual DOM 及 DOM diff 有关, 可以用来唯一标识DOM节点,提高diff效率,云云. 这大致是对的,但是,大多讲得语焉不详, ...

  9. day14.面向对象编程

    一 对象的概念 "面向对象"的核心是"对象"二字,而对象的精髓在于"整合" 所有的程序都是由"数据"与"功能& ...

  10. Insertion Sort and Merge Sort

    Insertion Sort(插入排序) 思路:for 循环遍历数组中的每一个数 用while将每次遍历到的数于左侧的数进行对比,将小的排到左边 void InsertionSort(int*A, i ...