Sub MainProc() Dim Sht As Worksheet Dim Wb As Workbook Set Wb = Application.ThisWorkbook Set Sht = Wb.Worksheets(1) Sht.Cells.Clear Sht.Range("A1:D1").Value = Array("中文标题", "英文标题", "关键词", "文件名称") 'FolderPa…
先说说dedecms头部标题,关键词,描述标签的作用我相信网络上也有很多这样的信息,那为什么我还要写这个?因为这个对我们初学者来说还是比较重要的,因为做SEO就要用到这些标签.首先我写下首页头部标签我先把这些标签写下来,以便大家阅读方便.<title>{dede:global.cfg_webname/}</title><meta name="description" content="{dede:global.cfg_description/}&…
最近时间比较忙,有时候很多网页需要临时保存,以便空闲的时候查看.单纯的保存网页链接会让人很枯燥,所以需要自动批量提取标题. 为了这个小功能去写个小程序有点不划算,所以就利用excel实现了这个功能. 先上图: 代码如下: Option Explicit Public Function GetTitle(url As String) Dim xmlHttp As Object Dim strHtml As String url = Trim(url) )) = "https" Then…
WordPress标题.关键词和描述,之所以简洁,那是站在SEO的角度来考虑的. 首先,现在关键词这个标签早已被搜索引擎扔进历史的垃圾堆,所以这个keywords标签已经没用了,不写也罢. 其次,描述的作用已经非常小了,除了首页.分类页.标签页,最好自定义描述之外,文章页的描述也不用写了,搜索引擎会自动调用文章的内容来展示搜索结果页的描述.也就是description这个标签只要出现在首页.分类页和标签页这些重要的聚合页面就可以了. 好了,看一下简洁的WordPress标题.关键词和描述是怎么写…
之前想研究下怎么抓网页数据.然后就有了下面的练习了. 如有BUG.也纯属正常. 只是练习.请勿投入产品使用. #!/usr/bin/python # -*- coding: utf-8 -*- #Filenaem: tqjinyan.py import os,sys,time,urllib2,re import cookielib import multiprocessing import datetime,time #定义存储完整的数据字典 #keyword: 具体短链接地址,发布时间,标题,…
如何从网页上抓取有价值的东西?看懂了下面的程序(非常简单),想从网页上抓取什么信息(标题.内容.Email.价格等)就能抓取什么信息. package catchhtml; import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.net.MalformedURLException; import java.net.URL; import jav…
前段时间,领导要求出一个关键字提取的微服务,要求轻量级. 对于没写过微服务的一个小白来讲.有点赶鸭子上架,但是没办法,硬着头皮上也不能说不会啊. 首先了解下公司目前的架构体系,发现并不是分布式开发,只能算是分模块部署.在上网浏览了下分词概念后,然后我选择了Gradle & HanLP & SpringBoot & JDK1.8 & tomcat8 & IDEA工具来实现. Gradle 我也是第一次听说,和Maven一样,可以很快捷的管理项目需要的jar.下载,解压…
本文是csu_zipple 分享的关于使用hanlp汉语言处理包提取关键词的过程一个简单的记录分享.想要使用hanlp提取文本关键词的新手朋友们可以参考学习一下! 如何在一段文本之中提取出相应的关键词呢? 之前有想过用机器学习的方法来进行词法分析,但是在项目中测试时正确率不够.于是这时候便有了 HanLP-汉语言处理包 来进行提取关键词的想法. 下载:.jar .properties data等文件 请到大快搜索官网下载 HanLP新版本,1.7.1数据包下载[gitub上也可以下载] 在int…
一.TextRank原理 TextRank是一种用来做关键词提取的算法,也可以用于提取短语和自动摘要.因为TextRank是基于PageRank的,所以首先简要介绍下PageRank算法. 1. PageRank算法 PageRank设计之初是用于Google的网页排名的,以该公司创办人拉里·佩奇(Larry Page)之姓来命名.Google用它来体现网页的相关性和重要性,在搜索引擎优化操作中是经常被用来评估网页优化的成效因素之一.PageRank通过互联网中的超链接关系来确定一个网页的排名,…
今天要介绍的TextRank是一种用来做关键词提取的算法,也可以用于提取短语和自动摘要.因为TextRank是基于PageRank的,所以首先简要介绍下PageRank算法. 1.PageRank算法 PageRank设计之初是用于Google的网页排名的,以该公司创办人拉里·佩奇(Larry Page)之姓来命名.Google用它来体现网页的相关性和重要性,在搜索引擎优化操作中是经常被用来评估网页优化的成效因素之一.PageRank通过互联网中的超链接关系来确定一个网页的排名,其公式是通过一种…