CSDN_帖子__WapPc】的更多相关文章

CSDN的帖子,Wap版 和 PC版 网址对应关系: 1. 举个例子: 手机版的网址: http://bbs.csdn.net/wap/topics/391891319 PC版的网址: http://bbs.csdn.net/topics/391891319 2.…
CSDN 博客  手机上的网址 和 PC上的网址,对应关系: 1. 举个例子: 手机上的网址: http://m.blog.csdn.net/article/details?id=7910239 PC上的网址: http://blog.csdn.net/jiejiaozhufu/article/details/7910239 ZC:jiejiaozhufu 是 CSDN博客 的 博主的用户名.…
最近发现天涯论坛是一个挺有意思的网站,有各种乱七八糟的帖子足以填补无聊时候的空虚感,但是相当不爽的一件事就是天涯的分页模式下想连贯的把楼主的内容看完实在是太心酸了,一个999页的帖子,百分之九十都是无聊网友的灌水,有时候连续翻几十页才能找到楼主的一条内容.所以无聊之下,就打算写一个简单的爬虫,能一次性把某一个帖子下楼主的所有内容一次性的下载下来.好吧,说了这么多废话,现在开始讲点正事. 网页的地址形式:http://bbs.tianya.cn/post-no05-355576-1.shtml,其…
之前,在用ENode开发forum案例时,遇到了关于如何实现论坛帖子的回复的统计信息如何更新的问题.后来找到了自己认为比较合理的解决方案,分享给大家.也希望能和大家交流,擦出更多的火花. 论坛核心领域问题分析 论坛领域的核心概念是:帖子.回复.大家都知道,一个帖子可以有零个或多个回复.对同一个帖子,不同的人可以并行发表回复.回复发表后,查看帖子详情时,可以根据回复的发表时间排序显示:此外,我们还关心某个帖子的最新发表的回复.最新回复的作者.最新回复时间,以及总回复数. 我们设计的系统,应该在实现…
设置路径: 全局 -> 站点功能 -> 帖子阅读 -> 启用隐藏水帖,选择“否”…
<?php /* * Disucz!部分功能使用说明: */ /********************************************************************** 用户注册 ***************************************************************************/ /* uc_user_register接口只是把用户数据验证后插入到pre_ucenter_members表中 * 所以需要手动将…
在网上看到爬百度贴吧的例子,仿照写了一个用BeautifulSoup实现的,直接上代码吧 #coding:gbk import urllib2 from bs4 import BeautifulSoup import re import os class TiebatoTxt: def __init__(self, url, seeLZ): #传入url self.url = url #是否只看楼主 self.seeLZ = '?see_lz='+str(seeLZ) self.floor =…
同样是参考网上教程,编写爬取贴吧帖子的内容,同时把爬取的帖子保存到本地文档: #!/usr/bin/python#_*_coding:utf-8_*_import urllibimport urllib2import reimport sys reload(sys)sys.setdefaultencoding("utf-8")#处理页面标签,去除图片.超链接.换行符等class Tool: #去除img标签,7位长空格 removeImg = re.compile('<img.*…
<!--{echo htmlspecialchars_decode(discuzcode($post[message], , , , , , , , , , ));}--> 在discuz二次开发中调用discuz的编辑器是一件在所难免的事情,然而discuz的开发文档少得可怜:因此在二次开发的时候查看源码和各种莫名其妙的问题着实令人摸不着头脑.前面讲解了一下调用discuz编辑器的实例 调用discuz编辑器再也不是问题了.然而这只是一个粗糙的例子,而discuz帖子存储在数据库的却是自定义…
发个博客太麻烦了,难怪写博客的越来越少,吐一下,cnblogs的编辑器模板太丑! 最近开发社区 需要采集一些数据,使得模板输出有图文效果.就写了个简单的采集脚本,爬取目标站的内容,(用php 下载图片 处理起来比较麻烦).有了数据 就要插入到dz的数据库 ,随便命名一个 test.php 放在discuz 的web根目录下.操作一下 花了点功夫,中间有不少头疼的时候.特记录.两个注意点,一 ,Discuz的帖子 存储在帖子表 pre_forum_post ,message 字段,这里的图片 和换…