Beta设计和计划 —— NameNotFound
需求再分析
1. 用户群体
经过用户(大多数是同学)的反馈,我们发现大家其实并不是十分明确我们要做的到底是什么、具体要怎么用。而实际上我们的典型用户也并不是学生群体,因此出现这些偏差也是很正常的,毕竟学生群体没有这方面的需求。所以我们准备更偏向于学生群体,尝试将这一功能向学生开放,比如说:实现一个表格数据生成pdf的功能。
2. 新功能的需求
与zx老师开会讨论后,我们对于新功能进行了需求分析:
用户在使用表单软件时,可能并不想自己费力的标注,而是希望直接上传使用,从这一个角度,我们决定,在Beta阶段,释放用户,由软件来替用户做决定,猜测用户需要的数据字段,自动训练,方便用户直接使用。
3. alpha阶段的反馈中提到了服务器慢的问题。
- 这个是因为我们采用的服务器是在美国的,针对这一问题,我们已经配置了CDN加速,现在提供了两个网站入口地址,方便用于选择适合自己的。
- 目前整个软件前后端要实现数据同步,所以在标注的阶段,会反应很慢,这一点很影响用户体验,我们会尝试进行优化。
4. 有同学反馈我们只针对英文。
这个确实如此,因为Fott的ocr就是针对英文的,而我们的目的就是基于此ocr开发工具,而不是去开发ocr,而且我们的项目一定程度上基于微软原项目开发(虽然现在思路已经跑偏了,但是前端架构是没有很大的改变的)。因此一定程度上,这个软件就无法满足同学们的需求,我们会在这一阶段考虑是否使用其他的OCR识别来扩展语言,但这一点不是主要的需求。
整体上来说,在beta阶段,我们将:
- 完善alpha阶段出现的一些问题,并将alpha阶段所得到的成果进一步应用在FOTT项目中去,实现生成即训练的目标
- 增加项目描述和使用的介绍,让同学们能够了解我们在做什么
- 此外,我们将扩展一部分功能,支持用户能够无需手动标注,轻松得出结果。
- 对于软件处理结果,我们会将其一一提取出来,生成一个Excel文件,能够更清晰地观察到各个字段的数据分布,同时在data页面支持数据的分析可视化,表单识别的结果直观又清晰。
- 完善项目管理:代码管理、文档管理、测试等
功能增加
功能 | 详细描述 |
---|---|
introduction页面 | 增加项目描述和使用方法 |
train页面 | 支持对生成好的页面进行一键训练 支持将训练得到的结果进行处理,生成Excel文件 |
data页面 | 支持数据可视化查看 |
tag页面 | 支持错误画出的框的删除 |
model页面 | 支持历史模型的显示 |
new project | 支持用户选择项目类型(空白训练;五张训练;根据Excel信息批量生成表单等) |
技术改进
代码规范:
- 开发语言仍为TypeScript和python,因此延续alpha阶段的代码规范
- 加强对于代码复审的管理,严格commit和issue之间的联系
- 加强文档管理——GitHub wiki
新的技术:
- NLP处理实体识别,预测用户需要的数据字段
- Azure 认知服务——文本分析,实体识别
- Itext处理PDF文件,实现丰富的操作
- 进程调度——redis,分布式锁
- NLP处理实体识别,预测用户需要的数据字段
任务拆解
前端
- 项目功能的切换:空白表单、已填好表单、表格转pdf——zyc主要负责
- 完善前端并且修bug——zyc,lzh主要负责
- OCR训练模块的添加——lzh主要负责
后端
- pdf文件操作(文字删除,替换等)——dxy主要负责
- alpha阶段数据生成模块的扩展——dxy主要负责
- 后端服务器维护和完善(分布式锁,新需求)——ly主要负责
新功能开发
- 实体识别的调研和实现——ly,llj主要负责
- 对OCR模型预测输出结果进行表格整理和可视化——wyk主要负责
- 表格文件批量转pdf文件——wyk主要负责
细粒度划分:
任务 | 分工 | 截止时间 |
---|---|---|
前端:重构strings | zyc | 5.15 |
前端:优化tag页面上传时提示 | zyc | 5.15 |
前端:new project页面 | zyc | 5.14 |
前端:完善tag页面 | zyc | 5.14 |
前端:与new project的配合 | zyc | 5.17 |
前端:新增model页面 | lzh | 5.19 |
前端:新增data页面 | lzh | 5.19 |
前成员:熟悉项目 | lzh | 5.15 |
前端:new project时短暂报错 | zyc | 5.16 |
后端:PDF文字擦除 | dxy | 5.15 |
后端:响应前端 | ly | 5.27 |
后端:Excel可视化处理 | wyk | 5.22 |
后端:Json数据整合 | ly,llj | 5.22 |
后端:实体识别 | llj,dxy | 5.20 |
后端:Json文件分析 | dxy,ly | 5.20 |
后端:学习nlp,azure认知服务 | ly,dxy,llj | 5.20 |
新功能:实体识别调研 | ly,llj,dxy | 5.17 |
前端需要增量开发的任务不是很多,后续会有前端人员参与后端的新技术开发!
人员管理:
首先欢迎新成员lzh的加入!
经过了解,lzh有OCR项目的相关经验,也使用过TypeScript语言,所以他的加入正好补上了我们原有成员tzj(前端成员)工作的空缺。
培训
我们在昨日的每周例会上大概讲述了Alpha阶段的工作和技术流,为lzh介绍了先前工作,又得益于之前的文档和视频(疯狂捞自己),他现在处于熟悉项目阶段,相信很快就能够融入到团队中来!
团队成员之间也会及时沟通,解决问题。
新的分工
PM进行更换。Ly担任NameNotFound的新PM,Wyk变为开发组,实现新需求和新功能!
经过反思,我们发现,alpha阶段有部分的工作是无法体现在项目需求中的,因此,我们进行了取舍,将相关同学转移到后端组,进行新功能的开发。
Beta阶段的新功能遇到一定的技术难题,暂时由后端成员调研和解决,后续可能会有前端成员转到这一问题上!
Alpha阶段经验总结和Beta阶段的改变:
对已有工作文档的维护:
我们发现之前的文档管理对于查看查询很不方便,在新成员的建议下准备将已有的文档都迁移到GitHub项目的wiki部分
技术文档和说明文档都迁移到GitHub的wiki (正在做)
技术博客同步发布在wiki
代码管理
之前的代码管理还是有不到位的地方,经过alpha阶段的评审,我们决定严格这一部分,
- 前后端分别创建dev分支进行日常开发和测试,以及代码复审
- 每周选择固定时间来进行整体代码复审和merge
- 将bug和commit关联起来;至少也要在issue页面说明修改的部分
测试和Bug修复
原项目的遗留Bug很多,所以我们还需要进行更多测试来完善前端页面。
基于alpha阶段的测试,优化前端的体验!
Beta设计和计划 —— NameNotFound的更多相关文章
- [知识路书]beta设计和计划
[知识路书]beta设计和计划 一.需求再分析 根据用户反馈,是否发现之前的需求分析有偏差?为什么会出现这种偏差?beta阶段你们是否能真的分析清楚用户需求?如何做到? 根据alpha阶段的推广情况以 ...
- beta设计和计划
项目 内容 课程:北航-2020-春-软件工程 博客园班级博客 要求 Beta设计和计划 我们在这个课程的目标是 提升团队管理及合作能力,开发一项满意的工程项目 这个作业在哪个具体方面帮助我们实现目标 ...
- [no_code][Beta]设计和计划
2020春季计算机学院软件工程(罗杰 任健) 2020春季计算机学院软件工程(罗杰 任健) 作业要求 Beta设计和计划 我们在这个课程的目标是 远程协同工作,采用最新技术开发软件 这个作业在哪个具体 ...
- [敏捷软工团队博客]Beta设计和计划
项目 内容 2020春季计算机学院软件工程(罗杰 任健) 博客园班级博客 作业要求 Beta设计和计划 我们在这个课程的目标是 在团队合作中锻炼自己 这个作业在哪个具体方面帮助我们实现目标 对Beta ...
- 【二食堂】Beta - 设计和计划
Beta设计和计划 需求再分析 根据助教.老师.用户以及各个团队PM的反馈意见,我们的项目目前有以下问题: 功能不完整 实用价值不高 两方面的缺陷,所以在Beta阶段,我们工作的中心还是完成项目规划中 ...
- [对对子队]Beta设计和计划
需求再分析 Alpha阶段用户反馈的问题主要有三个 新手引导部分没有明确指出合成按钮可以使用下拉框切换目标,因此不少玩家卡在第三关 觉得合成动画太长,希望可以快进或者跳过 对游戏目标很迷惑,不知道为什 ...
- UltraSoft - Beta - 设计与计划
在DDL Killer的Alpha发布版本一周后,我们积累了一定的用户数量和用户反馈,同时也着手准备Beta阶段的继续开发,在正式开始迭代前,先对我们的Beta阶段的需求做一个统计和预估,一是保证工作 ...
- 团队作业8——Beta版本冲刺计划及安排
团队作业8--Beta版本冲刺计划及安排 经过紧张的Alpha阶段,很多组已经从完全不熟悉语言和环境,到现在能够实现初步的功能.下一阶段即将加快编码进度,完成系统功能.强化软件工程的体会. 凡事预则立 ...
- 团队作业八-Beta版本冲刺计划及安排
Beta版本冲刺计划及安排 目录: 1.介绍小组新加入的成员,他担任的角色 2.下一阶段需要改进完善的功能 3.下一阶段新增(或修改)的功能 4.需要改进的团队分工 5.需要改进的工具流程 6.冲刺的 ...
随机推荐
- C语言数组寻址
C语言数组 数组的定义 数组是用来存放数据类型相同且逻辑意义相同的数据 数组的大小 数组的大小不能是变量,必须是常量或者常量表达式,常量表达式由编译器编译时自动求值. 也可以不指定数组大小,但必须对数 ...
- Detach blobs with a contact point
https://answers.opencv.org/question/87583/detach-blobs-with-a-contact-point/ 一.问题描述 带有接触点的斑点时遇到问题,需要 ...
- 最小生成树,Prim和Kruskal的原理与实现
文章首先于微信公众号:小K算法,关注第一时间获取更新信息 1 新农村建设 大清都亡了,我们村还没有通网.为了响应国家的新农村建设的号召,村里也开始了网络工程的建设. 穷乡僻壤,人烟稀少,如何布局网线, ...
- day-04-列表
列表的初识 容器型数据类型,可以承载大量的数据,有序的数据 why:int bool str:'123 True 太白' str: 存储少量的数据. str:切片还是对其进行任何操作,获取的内容全都是 ...
- [Fundamental of Power Electronics]-PART I-1.引言-1.2 1.3 电力电子技术的几个应用、本书内容
1.2 电力电子技术的几个应用 高效开关变换器面临的功率范围从 (1)小于1瓦(电池供电的便携式设备内的DC-DC转换器)到(2)计算机及办公设备中的几十,几百,数千瓦到(3)变速电机驱动器中上千瓦及 ...
- Spring MVC(七篇)
(一)Spring MVC简介 (二)SpringMVC核心控制器 (三)Spring MVC Controller接口控制器详解(一) (三)Spring MVC Controller接口控制器详解 ...
- Spring (三)SpringAoP
1.Spring 的 AOP 简介 1.1 什么是 AOP AOP 为 Aspect Oriented Programming 的缩写,意思为面向切面编程,是通过预编译方式和运行期动态代理实现程序功能 ...
- 深入剖析共识性算法 Raft
一. Raft简介 1.1 Raft简介 Raft 是一种为了管理日志复制的分布式一致性算法.Raft 出现之前,Paxos 一直是分布式一致性算法的标准.Paxos 难以理解,更难以实现.Raft ...
- K8s - 解决主机重启后kubelet无法自动启动问题 错误:The connection to the server 192.168.60.128:6443 was refused - did you specify the right host or port?
1,问题描述 (1)在安装配置好 Kubernetes 后,正常情况下服务器关机重启,kubelet 也会自动启动的.但最近配置的一台服务器重启后,输入命令 kubectl get nodes 查看节 ...
- GO-01-GoLang的快捷键