自然语言处理NLP学习笔记三:使用Django做一个NLP的Web站点
前言:
前面我们已经能初步实现一个中文自然处理语言的模型了,但交互界面是命令行的,不太友好。
如果想做一个类似http://xiaosi.trs.cn/demo/rs/demo的界面,那就还需要继续往下处理。
Django
由于Jiagu等使用了python语言,所以Web站点的实现,优先考虑到python的web框架。
而这里选择了还比较流行的Django。
教程参考:
https://www.runoob.com/django/django-tutorial.html
https://www.cnblogs.com/feixuelove1009/p/5823135.html
1. Diango安装
pip install Diango
2. 创建一个Web站点
使用 django-admin命令来创建一个叫ai的项目
进入部署目录,Anaconda promt下cd
anaconda集成下安装默认的目录是: \anaconda\Lib\site-packages\django\bin\
django-admin startproject ai
linux下命令:
linux下默认安装目录是:/usr/local/python3/lib/python3.7/site-packages/django/bin/
python django-admin.py startproject ai
3. 编写Web页面
1)设置环境信息,修改settings.py
django知道我们的html文件在哪里,需要修改settings文件的相应内容。默认下不用修改
'DIRS': []修改为 'DIRS': [BASE_DIR+"/templates", ]
同时注释以下行,暂时关闭一下django的csrf跨站请求保护机制(涉及用户输入时会调用到,如不处理会报错):
MIDDLEWARE = [
# 'django.middleware.csrf.CsrfViewMiddleware',
在ALLOWED_HOSTS = []中添加允许的IP ALLOWED_HOSTS = ['XX.XX.XX.XX']--当然,如果默认127.0.0.1运行,则不需要此步骤
2)表现层-创建template目录,并创建index.html
按Diango的分层思想,在界面显示的内容(表现层),放在模板Template中。
因此,我们先在项目下创建template的目录,并创建index.html文件。文件的内容后续补充。
3)UI-使用bootstrap美化界面
在项目中新建static目录,并放入bootstrap的目录。
同时在settings.py加入static目录的引用:
STATIC_URL='/static/'
STATICFILES_DIRS=(os.path.join(BASE_DIR, "static"),)
4) 控制器层-业务逻辑,修改view.py
这里用于向模板层提供数据,我们定义一个函数,html接收用户输入,view处理后返回给用户。
5)路由系统-urls.py
浏览器输入的url,通过这个urls.py文件转发到业务逻辑中
增加
import from ai import views
urlpatterns = [
path('admin/', admin.site.urls),
path('', views.login),
path('login/', views.login),
]
4. 启动Web服务
执行命令
python manage.py runserver 127.0.0.1:8000
python manage.py runserver IP:8000
5. 查看效果
浏览器打开url: http://127.0.0.1:8000/
主要代码:
views.py
# -*- coding: utf-8 -*-
from django.shortcuts import render
import jiagu # Create your views here.
from django.shortcuts import render,redirect words=""
keywords=""
knowledge=""
summarize=""
def login(request):
# request 包含用户提交的所有信息
words = ""
keywords=""
knowledge=""
summarize=""
text=""
pos=""
ner=""
newPos={}
newNer={} dict1 = {'B-PER':'人名','B-LOC':'地名','B-ORG':'机构名','I-PER':'人名','I-LOC':'地名','I-ORG':'机构名','O':'不是名词短语'}
dict2 = {'n':'普通名词','nt':'时间名词','nd':'方位名词','nl':'处所名词','nh':'人名','nhf':'姓','nhs':'名',
'ns':'地名','nn':'族名','ni':'机构名','nz':'其他专名','v':'动词','a':'形容词','m':'数词','d':'副词','w':'标点符号','ws':'非汉字字符串','i':'习用语','j':'缩略语',
'r':'代词','p':'介词','c':'连词','u':'助词','e':'叹词','vd':'趋向动词','vl':'联系动词','vu':'能愿动词','x':'非语素字','m':'数词','q':'量词','mq':'待定','o':'拟声词','k':'后接成分'} if request.method == 'POST':
inputText = request.POST.get('input',None)
output = request.POST.get('output',None)
text=inputText
words = jiagu.seg(text) # 分词,可以用model选择分词模式,不填则默认,mmseg则使用mmseg算法
if (len(text)<=6):
try:
keywords = jiagu.keywords(text, 1)
except ValueError:
print("关键词设置不当,请联系管理员!")
elif (len(text)<=30):
print(len(text))
keywords = jiagu.keywords(text, 3)
else:
try:
keywords = jiagu.keywords(text, 5)
except ValueError:
print("关键词设置不当,请联系管理员!") knowledge = jiagu.knowledge(text) # 知识抽取
summarize = jiagu.summarize(text, 1) # 摘要
pos = jiagu.pos(words) # 词性标注
ner = jiagu.ner(text) # 命名实体识别 j=len(pos)-1
tmp=0
tmp2=0
while tmp<=j:
k=pos[tmp]
newPos[tmp]=(words[tmp],k,dict2[k])
tmp=tmp+1 i=len(ner)-1
while tmp2<=i:
t=ner[tmp2]
newNer[tmp2]=(text[tmp2],t,dict1[t])
tmp2=tmp2+1
print(words)
print(keywords)
print(newPos)
print(knowledge)
return render(request, 'login.html',{"text":text,"words":words,"keywords":keywords,"knowledge":knowledge,"summarize":summarize,"pos":newPos,"ner":newNer})
login.html
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>login</title>
<style> label{ width: 80px;
text-align: right;
display: inline-block; }
</style>
<link rel="stylesheet" type="text/css" href="/static/bootstrap/css/bootstrap.min.css" >
</head>
<body>
<div class="container">
<form action="/login/" method="post" class="form-horizontal">
<filedset>
<legend><lable> <span class="glyphicon glyphicon-home"></span> NLP自然语言处理 </lable></legend> <div class="row">
<!--栅格系统,每row行共12列,分个3div,每1,3个div占3列,第2个div则占5列,即3列+5列+4列=12列-->
<span class="glyphicon glyphicon-pencil"></span> 请输入要处理的语言:
<input type="text" name="input" placeholder="请输入你要处理的文本:例如:广州市" class="form-control" style="margin: 20px 0px 0px; height: 104px; width: 807px;" required value={{text}} >
</div> <div class="row">
<br>
<div class="col-sm-7 col-sm-offset-7">
<input type="submit" value="一键处理" class="btn btn-xs btn-primary" >
<!-- <button type="reset" value="Reset" class="btn btn-xs btn-warning"></button>-->
</div>
</div> <legend><lable> <span class="glyphicon glyphicon-road"></span> 分析结果 </lable></legend>
<br>
<div class="row">
<div class="col-sm-3"><span class="glyphicon glyphicon-scissors"></span> 自动分词结果: </div>
<div class="col-sm-6">
{%for output in words%}
{{output}}
{% endfor %}
</div>
<div class="col-sm-3"></div>
</div> <br>
<div class="row">
<div class="col-sm-3" ><span class="glyphicon glyphicon-lock"></span> 关键词获取结果: </div>
<div class="col-sm-6">
{%for output in keywords%}
{{output}}
{% endfor %}
</div>
<div class="col-sm-3"></div>
</div> <br>
<div class="row">
<div class="col-sm-3" ><span class="glyphicon glyphicon-font"></span> 文本摘要: </div>
<div class="col-sm-6">
{%for output in summarize%}
{{output}}
{% endfor %}</div>
<div class="col-sm-3"></div>
</div> <br>
<div class="row">
<div class="col-sm-3" ><span class="glyphicon glyphicon-cog"></span> 词性分析: </div>
<div class="col-sm-6"> {{pos}}
</div>
<div class="col-sm-3"></div>
</div> <br>
<div class="row">
<div class="col-sm-3" ><span class="glyphicon glyphicon-th"></span> 实体识别: </div>
<div class="col-sm-6"> {{ner}}
</div>
<div class="col-sm-3"></div>
</div> <br>
<div class="row">
<div class="col-sm-3" ><span class="glyphicon glyphicon-tree-deciduous"></span> 知识图谱关系: </div>
<div class="col-sm-6"> {{knowledge}}
</div>
<div class="col-sm-3"></div>
</div>
</filedset>
</form>
</div> </body>
</html>
附:用到的知识:
1. Django获取用户界面表单提交过来的数据
view.py中:
if request.method == 'POST':
# 获取用户通过post 提交过来的数据
inputText = request.POST.get('input',None)
html中:
<form action="/login/" method="post" class="form-horizontal">
<input type="text" name="input" value={{text}} >
2. Django返回用户界面数据并展示在html中
view.js中
return render(request, 'index.html',{"text":text,"words":words})
html中:
<div class="col-sm-6">
{%for output in words%}
{{output}}
{% endfor %}
</div>
自然语言处理NLP学习笔记三:使用Django做一个NLP的Web站点的更多相关文章
- QML学习笔记(五)— 做一个简单的待做事项列表
做一个简单的QML待做事项列表,能够动态添加和删除和编辑数据 GitHub:八至 作者:狐狸家的鱼 本文链接:QML学习笔记(五)— 做一个待做事项列表 主要用到QML:ListView 效果 全部代 ...
- django创建一个简单的web站点
一.新建project 使用Pycharm,File->New Project…,选择Django,给project命名 (project不能用test命名) 新建的project目录如下: ...
- ROS学习笔记三:编写第一个ROS节点程序
在编写第一个ROS节点程序之前需要创建工作空间(workspace)和功能包(package). 1 创建工作空间(workspace) 创建一个catkin_ws: #注意:如果使用sudo一次 ...
- angular学习笔记(三十)-指令(9)-一个简单的指令示例
学了前面这么多关于指令的知识,现在就用指令来写一个小组件:expander 这个组件的功能就是点击开展菜单,再点击收起菜单: ↑↓点击展开收起 下面来看它的代码: html: <!DOCTYPE ...
- 【WPF】学习笔记(一)——做一个简单的电子签名板
参加实习(WPF)已经有两个多周的时间了,踩了一些坑,也算积累了一些小东西,准备慢慢拿出来分享一下.(●'◡'●) 这次呢就讲讲一个简单的电子签名板的实现. 先上张图(PS:字写得比较丑,不要太在意哈 ...
- angular学习笔记(三十)-指令(10)-require和controller
本篇介绍指令的最后两个属性,require和controller 当一个指令需要和父元素指令进行通信的时候,它们就会用到这两个属性,什么意思还是要看栗子: html: <outer‐direct ...
- iView学习笔记(三):表格搜索,过滤及隐藏列操作
iView学习笔记(三):表格搜索,过滤及隐藏某列操作 1.后端准备工作 环境说明 python版本:3.6.6 Django版本:1.11.8 数据库:MariaDB 5.5.60 新建Django ...
- Oracle学习笔记三 SQL命令
SQL简介 SQL 支持下列类别的命令: 1.数据定义语言(DDL) 2.数据操纵语言(DML) 3.事务控制语言(TCL) 4.数据控制语言(DCL)
- [Firefly引擎][学习笔记三][已完结]所需模块封装
原地址:http://www.9miao.com/question-15-54671.html 学习笔记一传送门学习笔记二传送门 学习笔记三导读: 笔记三主要就是各个模块的封装了,这里贴 ...
随机推荐
- 报错:required string parameter XXX is not present
报错:required string parameter XXX is not present 不同工具发起的get/delete请求,大多数不支持@RequestParam,只支持@PathVari ...
- Ubuntu 16.04安装docker详细步骤
1. 卸载之前的旧版本 sudo apt-get remove docker docker-engine docker-ce docker.io 2. 更新apt包 sudo apt-get upda ...
- Binary Stirling Numbers
http://poj.org/problem?id=1430 题目: 求 第二类 斯特林数 的 奇偶性 即 求 s2 ( n , m ) % 2 : 题解: https://blog.csdn.ne ...
- Mockito 2 关于打标(stubbing)
请参考下面有关于打标的代码. //You can mock concrete classes, not just interfaces LinkedList mockedList = mock(Lin ...
- codeforces412A
Poster CodeForces - 412A The R1 company has recently bought a high rise building in the centre of Mo ...
- PTA 二叉树路径
二叉树的路径 (25 分) 二叉树是一种普通的数据结构.给出一棵无限的二叉树,节点被标识为一对整数,构造如下: (1)树根被标识为整数对(1,1). (2)如果一个节点被标识为(a,b ...
- 使用yum安装nginx
在CentOS 7中安装Nginx. 当使用以下命令安装Nginx时,发现无法安装成功. 1 yum install -y nginx 需要做一点处理. 安装Nginx源 执行以下命令: 1 rpm ...
- 在Spring Boot快捷地读取文件内容的若干种方式
引言: 在Spring Boot构建的项目中,在某些情况下,需要自行去读取项目中的某些文件内容,那该如何以一种轻快简单的方式读取文件内容呢? 基于ApplicationContext读取 在Spri ...
- vue 的多页面应用
vue-cli3 中构建多页面的应用 第一步:先创建一个 vue-cli3 的项目:vue create app 然后运行项目:npm run serve 现在开始多页面的应用: 首先在 src 的目 ...
- https知识汇总
状态码 含义 100 客户端应当继续发送请求.这个临时响应是用来通知客户端它的部分请求已经被服务器接收,且仍未被拒绝.客户端应当继续发送请求的剩余部分,或者如果请求已经完成,忽略这个响应.服务器必须在 ...