NABCD-name not found
项目 | 内容 |
---|---|
课程 | 2020春季计算机学院软件工程(罗杰 任健) |
作业要求 | 团队项目选择 |
项目名称
FOTT
项目内容
在OCR-Form-Tools开源项目的基础上,扩展功能,支持演示更多的API,例如看本账户有多少个模型;支持更多的应用场景,例如生成支持编程小白直接运行的python代码,只要提供endpoint和app key即可直接开始运行极大地简化上手难度和编程操作等。
Need
对于各类有大量表单数据录入的企业或机构而言,如何实现大量纸质表单的快速智能电子化非常重要,针对票据表单的OCR表格识别技术在表格数据采集和应用之间架起高速通道。本项目可以节省大量的数据录入工作量、大大加快数据录入的效率、提高数据录入的准确性、并实现大量纸质表单原图的安全保存,能够满足各行各业的需求,让公司的业务摆脱手工。并且现在OCR的市场已经比较成熟,比如银行、保险、金融、税务、海关、公安、边检、物流、电信工商管理、图书馆、户籍管理、审计等很多行业都已经应用了OCR技术。而OCR-Form-Tools开源项目的在线工具部署在Azure上,国内访问比较困难,其他方法需要较高的计算机能力,因此我们的项目对没有较强计算机能力或网络环境的文字编辑非常友好。
Approach
项目基于微软的OCR Form Labeling Tool,将其他的功能开发成可视化程序,主要从两个角度开发:
基于微软FOTT的API接口,扩展功能,完善当前的Web应用
因为原应用是一个React + Redux Web应用,使用TypeScript语言(是JavaScript的超集,最终会被编译为JavaScript代码)开发 ,这也是我们进行扩展开发所使用的技术;
基于已有的逻辑生成Python代码,便于开发者调试和测试
技术基于React和TypeScript。
因为我们组大部分队员都很少有大型项目开发的经验。这次能够基于微软开源的项目的进行功能开发和完善是一个很好的平台,也是很大的挑战;我们也有很多需要学习的新知识和理论,并且在不算充足的时间里应用于实践,大概也能让我们很好的体会"敏捷开发"。在实践开发过程中,肯定会面临很多困难,但是作为一个团队前进,大家也一定会交流探讨,互帮互助,各司其职;再加上课程组和微软高级工程师专业的指导,大概也会是approach的buff加持。
Benefit
- 容易上手、操作简单,不需要较高的编程能力或专业知识背景;
- 文本分割粒度细,正确率较高;对手写字体也识别精准;
- 用户可以手动更改各种表单训练集,标记tag再训练模型,可选取任意信息输出,实现重要信息的识别提取和不重要信息的过滤;
- 功能丰富、形式多样,支持表格、收据等多种API;格式支持广泛,常见的图片、pdf均可;
Competitor
现在市面上有多种OCR识别软件、但这种专门是针对表单的OCR项目却并不多见。
以睿琪票据智能识别平台为例,只提供了发票、火车票等相关功能,不能实现任意表单的任意数据的提取。
同时,我们的项目能够实现让没有多少编程经验的人放心使用,而市面上的大多数工具只是提供了一个API接口,具体代码需要自己实现,对没有编程能力的使用者非常不友好。
Delivery
- 主要网站上线,参考:https://fott.azurewebsites.net/
- 源码:github(支持本地编译按照使用,需要一定的计算机知识,提供教程也是不错的选择)
- 前期主要考虑在同学、老师中宣传,搜集初步的应用反馈(调查问卷等);后期可以考虑通过知乎、公众号等进行推广。
用户量评估
发布一周,预估用户量400。
要点组合
各位领导/合作伙伴: 我们的 OCR功能增量开发以及API的完善是为了解决个人和企业面对大量表单数据以及OCR工具上手不易的痛苦, 他们需要获取各类表单(pdf、卡证、票据等)的数据进行自动识别、信息抽取、审核、对比等, 但是现有的方案并没有很好地解决这些需求,我们有现已较成熟的基于React和TypeScript的技术来支持相应功能的实现, 它能给用户带来易上手、个性化可定制、精准识别、功能完善的使用体验, 远远超过竞争对手 天若OCR、睿琪票据智能识别平台等,包括我们以前的版本。我们相信新的改进能给我们带来更多用户以及落地的实用性改善,甚至应用于商业领域。值得期待。
NABCD-name not found的更多相关文章
- 利用NABCD模型进行竞争性需求分析
微博的NABCD模型 N-Need:毫无疑问,当今的中国普通民众是有这点需求的,在上个世纪中国民众的休闲娱乐方式更多的停留在以电视传媒为主的娱乐方式,而进入21世纪以来中国民众的娱乐中心向互联网转移, ...
- [课程设计]Scrum 1.1 NABCD模型&产品Backlog
多鱼点餐系统WEB NABCD模型 & 产品Backlog ● 一.NABCD模型 1) N (Need 需求) 为了解决餐饮企业在同行中的竞争优势,减少顾客到店后的点餐.等餐及结算过程消耗 ...
- PhyLab2.0需求与功能分析改进文档(NABCD)
PhyLab1.0需求规格说明文档 1. 概述 1.1 项目概述 软剑攻城队小组于2015学年开发了PhyLab物理实验网站,一经发布好评如潮.网站的核心功能是提供预习报告和自动数据处理,而后加入了论 ...
- 团队项目作业:利用NABCD模型进行竞争性需求分析
NABC正是这样的一套框架,当你试图提出一项崭新的提案之际,它能够提供四个思维基点,令你的商业策划具备天马行空的基础. 具体来说,NABC是四个关键词的首字母缩写- Need(需求)-现在市场上未被满 ...
- NABCD需求分析
1. N 需求 如今的社会,每个公司每个人都有大量的信息需要处理.保管和查询,这就难免会有些信息在个人电脑中保存的位置被遗忘,需要一款简单并且实用的搜索引擎来搜索个人 所需求的信息. 2. A ...
- 饭团(1):用NABCD大法为项目奠基
上一篇文章:提升效率的开发工具 提到高效的开发工具就像催化剂,加速项目开发.这篇文章提到的NABCD大法,就像一份地图,指引项目往正确的方法上发展. 选择比努力更重要.一个项目成功自然离不开码农们的努 ...
- NABCD——竞争性需求分析的框架
最近在读邹欣老师的书<构建之法>,读到很多地方,相当有感触,有种一拍大腿“啊,他说的太对了”的感觉,但都疏于记录,今天又看到一个一拍大腿特带感的一节,决定记录下来. 竞争性需求分析的框架— ...
- 思甜雅--关于qq的NABCD模型分析
个人连接:http://www.cnblogs.com/xiaoliulang/ 关于QQ的NABCD模型 N--Need 随着电脑的普及,人们在网络上进行交流的时间越来越多,由于现有的交流工具还不是 ...
- 团队项目NABCD模型的需求分析
团队项目NABCD模型的需求分析 NABCD模型的介绍 Need(需求)-现在市场上未被满足但又急需满足的客户需求是什么?Approach(方法)-要满足这种需求,我能够提出什么独特的方法吗?Bene ...
- 团队项目作业第二项:利用NABCD模型进行竞争性需求分析
项目需求分析与建议--NABCD模型(王鲁跃负责) N (Need 需求) 对于现在的学生来说,我们认为打字是很重要的.不管在什么方面都需要进行电脑打字,例如文员.QQ.MSN.制作,论文等等,都需要 ...
随机推荐
- 【wp】2021V&NCTF
前几天打完的V&NCTF公开赛,做题的时候没记过程,这是复现wp. 最后排名Top 18,三道RE+两道杂项(wp没啥可放的hhh)+一道web,感觉re题目还是挺好的,难度适中点赞,尤其pc ...
- [源码解析] 并行分布式框架 Celery 之 worker 启动 (2)
[源码解析] 并行分布式框架 Celery 之 worker 启动 (2) 目录 [源码解析] 并行分布式框架 Celery 之 worker 启动 (2) 0x00 摘要 0x01 前文回顾 0x2 ...
- OAuth2.0授权码模式实战
OAuth2.0是目前比较流行的一种开源授权协议,可以用来授权第三方应用,允许在不将用户名和密码提供给第三方应用的情况下获取一定的用户资源,目前很多网站或APP基于微信或QQ的第三方登录方式都是基于O ...
- 无法打开“×××”,因为无法确认开发者的身份——解决办法
当打开这些应用程序时,系统提示无法打开" XXX",因为它来自身份不明的开发者.我们可以按照下面的方法解决. 教程 1.打开应用程序,找到你要打开的软件.按住control键,点击 ...
- Spring Cloud:面向应用层的云架构解决方案
Spring Cloud:面向应用层的云架构解决方案 上期文章我们介绍了混合云,以及在实际操作中我们常见的几种混合云模式.今天我们来聊一聊Spring Cloud如何解决应用层的云架构问题. 对于Sp ...
- 什么是 Jenkins? 运用Jenkins持续集成
[注]本文译自:https://www.edureka.co/blog/what-is-jenkins/ 持续集成是 DevOps 最重要的部分,用于集成各个 DevOps 阶段.Jenkins ...
- ASP.NET扩展库之Http日志
最佳实践都告诉我们不要记录请求的详细日志,因为这有安全问题,但在实际开发中,请求的详细内容对于快速定位问题却是非常重要的,有时也是系统的强力证据.Xfrogcn.AspNetCore.Extensio ...
- oo第四单元——UML图解析
本单元是在理解UML图的基础上实现对图的解析和检查.UML图是新接触的一种建模工具,一开始接触UML的时候觉得理解起来比较困难,并不能单纯从代码的角度按照类.方法这样来理解,这只是从类图的角度,还有从 ...
- OLAP引擎:基于Presto组件进行跨数据源分析
一.Presto概述 1.Presto简介 Presto是一个开源的分布式SQL查询引擎,适用于交互式分析查询,数据量支持GB到PB字节,Presto虽然具备解析SQL的能力,但它并不属于标准的数据库 ...
- 关于Maven中<packaging>产生的一些问题
关于Maven中产生的一些问题 一.项目的打包类型 jar 默认的打包格式 war 打包成需要部署的项目 pom 父类型为pom类型 二. pom 简单来说,一个多模块项目通过一个父POM 引用一个或 ...