因为缓存数据的buffer总是不够大(会引起段错误)索性从堆上拿了两块大内存

/*
功能说明:逐日存储来访用户(使用伯克利DB)
根据存储的用户信息确定某用户是否是首次来访用户(未被存储的伯克利DB) 调用方式1: 查询游客在2013年8月8日是否访问了指定渠道
./channeldb -s "bch2000 guest:123456789" 20130808
调用方式2:将指定文件里的用户信息写入DB,同时将该文件里的首次访问用户写入日志
./channeldb -f 20130809 ./clog/20130809.log 20130809
*/ #include <assert.h>
#include <stdlib.h>
#include <stdio.h>
#include <string.h>
#include <db.h>
#include <sys/types.h>
#include <getopt.h> #define DATABASE "/mnt/disk1/ucshuqi/touch/userlist/historydb/channel.db"
#define YES 1
#define NO 0
#define BUFFER_SIZE 1024 * 8 char *readBuffer = NULL;
char *writeBuffer = NULL; /* ViewData 组件:记录
用户第一次来访时需要记录的数据,例如日期
*/ struct ViewData {
int date;
}; void setDate(struct ViewData *data,char *s)
{
assert(data!=NULL && s!= NULL && strlen(s) == );
data->date = atoi(s);
} /*当 query.date >= stored.date 返回YES,即包含此附属数据的用户信息是历史来访用户*/
int isHistoryViewInfo(struct ViewData *query , struct ViewData *stored)
{
assert(query != NULL && stored != NULL);
printf("query date is %d , stored date is %d \n",query->date, stored->date); if(query->date >= stored->date)
{
return YES;
}
else
{
return NO;
}
} void printViewData(struct ViewData *data)
{
assert(data != NULL);
printf("print view date : %d\n",data->date);
} /* string helper module */ char *trim(char *s)
{
int i; assert(s!=NULL);
i = strlen(s);
for(;i>;i--)
{
if(s[i]==' ' || s[i]=='\n' || s[i]=='\0' || s[i]=='\t')
{
s[i] = '\0';
}
else
{
break;
}
}
return s;
} /* 数据库访问 组件*/ DB *openDb()
{
int ret;
DB *dbp = NULL; ret = db_create(&dbp, NULL, );
if(ret != )
{
fprintf(stderr,"create Db error!\n");
exit();
} ret = dbp->open(dbp, NULL, DATABASE, NULL, DB_BTREE, DB_CREATE,); if(ret != )
{
fprintf(stderr,"open Db error!\n");
exit();
} return dbp;
} /* 业务逻辑 */ /* 存储用户访问信息和附属信息viewdata */
int saveViewInfo(DB *dbp, char *user, struct ViewData *data)
{
DBT key,value; assert(dbp != NULL && user != NULL && data != NULL); memset(&key, , sizeof(key));
key.data = user;
key.size = strlen(user) + ; memset(&value, , sizeof(value));
value.data = data;
value.size = sizeof(*data);
if(dbp->put(dbp, NULL, &key, &value, ) == )
{
//printf("save ---> %s, %d\n", key.data, key.size);
printViewData(value.data);
return YES;
}
else
{
return NO;
}
} /*查找用户访问信息,并将附属信息写入data*/
int findViewInfo(DB *dbp, char *user, struct ViewData *data)
{
DBT key,value; assert(dbp != NULL && user != NULL && data != NULL); memset(&key, , sizeof(key));
key.data = user;
key.size = strlen(user) + ; memset(&value,,sizeof(value)); // must !!! if(dbp->get(dbp, NULL, &key, &value, ) == )
{
memcpy((char*)data,(char*)value.data,value.size);
//printViewData(data);
return YES; //view in database
}
else
{
return NO; //view not in database
}
} /*记录用户信息,如果用户是首次来访*/
void recordNewView(FILE *fp, char *user, char *buffer)
{
//char buffer[BUFFER_SIZE] = {0};
assert(fp != NULL && user != NULL && buffer != NULL);
printf("%s is new view\n", user);
sprintf(buffer, "%s found\n", user);
fwrite(buffer, sizeof(char), strlen(buffer), fp);
} /*存储访问信息到数据库,同时写入附属信息*/
void saveViewFile(char *from, char *to, struct ViewData *writeData)
{
DB *dbp = openDb();
struct ViewData stored;
FILE *fp = fopen(from,"r");
FILE *fpResult = fopen(to,"w"); assert(fp != NULL && fpResult != NULL && writeData != NULL);
assert(readBuffer != NULL && writeBuffer != NULL); /* clear global buffer content */
memset(readBuffer, , BUFFER_SIZE);
memset(writeBuffer, , BUFFER_SIZE); while(fgets((char*)readBuffer, BUFFER_SIZE, fp)!=NULL)
{
char *user = trim((char*)readBuffer);
memset(&stored, , sizeof(stored)); if(findViewInfo(dbp, user, &stored) == YES)
{
if(isHistoryViewInfo(writeData,&stored) == NO)
{
recordNewView(fpResult, user, writeBuffer);
}
continue;
} recordNewView(fpResult, user, writeBuffer);
if(saveViewInfo(dbp, user, writeData) == NO)
{
printf("save %s faild\n", user);
} /* clear global buffer content */
memset(readBuffer, , BUFFER_SIZE);
memset(writeBuffer, , BUFFER_SIZE);
} free(readBuffer);
free(writeBuffer);
dbp->close(dbp, );
fclose(fp);
fclose(fpResult);
} /*给命令行调用的接口,找茬指定的用户是否是历史用户*/
void hasViewInfo(char *user, struct ViewData *query)
{
DB *dbp = NULL;
struct ViewData stored; dbp = openDb();
assert(user != NULL && query != NULL);
memset(&stored, ,sizeof(stored));
user = trim(user); if(findViewInfo(dbp, user, &stored) == YES)
{
if(isHistoryViewInfo(query, &stored) == YES)
{
printf("found %s\n",user);
}
else
{
//printf("%s in db\n",user);
printf("not found %s\n",user);
}
}
else
{
printf("%s not in db\n",user);
printf("not found %s\n",user);
} dbp->close(dbp, );
} int main (int argc, char *argv[])
{
int oc;
extern char *optarg;
extern int optind, opterr, optopt; char *from = NULL;
char *to = NULL; struct ViewData viewData;
memset(&viewData, , sizeof(viewData)); readBuffer = malloc(BUFFER_SIZE);
writeBuffer = malloc(BUFFER_SIZE); while((oc=getopt(argc,argv,"f:s:t:")) != -)
{
switch(oc)
{
case 's':
setDate(&viewData,argv[optind]);
hasViewInfo(optarg, &viewData);
break; case 'f':
from = optarg;
to = argv[optind++];
setDate(&viewData,argv[optind]);
saveViewFile(from, to, &viewData);
break;
}
} return ;
}

C语言读写伯克利DB 4的更多相关文章

  1. C语言读写伯克利DB 3

    gcc -o channeldb channel.c -db -Wall # -Wall参数等价于执行lint,即:进行代码的静态分析,它可以指出未初始化的变量,未使用的变量 #include < ...

  2. C语言解析日志,存储数据到伯克利DB

    编译命令 gcc -o dbwriter dbwriter.c -ldb dbwriter.c #include <assert.h> #include <stdlib.h> ...

  3. R语言读写中文编码方式

    最近遇到一个很头疼的事,就是 R语言读写中文编码方式.在网上找到了一篇博文,谢谢博主的精彩分享,让我很快解决了问题,在此也分享一下 R语言读写数据的方法很多,这里主要是我在使用read.csv/rea ...

  4. 伯克利DB的一个BUG

    一旦没有手工close掉伯克利DB,则缓存里的数据不会主动写入到文件中,因此非常难于排查这个BUG,记录在这里提醒自己

  5. R语言读写数据

    R语言读写数据 一般做模型的时候,从外部的excel中读入数据,我现在常用的比较多的是read_csv(file) 读入之前先把excel数据转化成.csv格式 同样的把结果输出来的时候用的是writ ...

  6. C++封装C语言读写文件

    自己项目需要,封装C语言读写文件. 为了兼容低版本的编译器,因为低版本的编译器(比如,Vs2010,Vs2008)他们可能不支持 modern c++. 项目 使用 cmake管理的项目. 可以在 g ...

  7. C语言解析日志,存储数据到伯克利DB 2

    #编译程序 gcc -o historydb historydb.c -ldb #将2013年8月9日的用户记录写入数据库 (程序自动识别新用户入库,跳过老用户) ./historydb -f .us ...

  8. C语言读写文件

    对文件的读和写是最常用的文件操作.在C语言中提供了多种文件读写的函数: 字符读写函数  :fgetc和fputc 字符串读写函数:fgets和fputs 数据块读写函数:freed和fwrite 格式 ...

  9. Go 语言读写 Excel

    Excelize 是 Golang 编写的一个用来操作 Office Excel 文档类库,基于微软的 Office OpenXML 标准.可以使用它来读取.写入 XLSX 文件.相比较其他的开源类库 ...

随机推荐

  1. 使用 ExpandableListView 实现折叠ListView

    1:layout/expandablelistview_groups.xml 标题文件 <?xml version="1.0" encoding="utf-8&qu ...

  2. HADOOP之HIVE+MYSQL,HBASE+ZOOKEEPER

    这个搞得有劲哈哈 继续...继续....

  3. PYTHON线程知识再研习E---条件变量同步Condition

    Python提供的Condition对象提供了对复杂线程同步问题的支持.Condition被称为条件变量,除了提供与Lock类似的 acquire和release方法外,还提供了wait和notify ...

  4. Android SDK 下载速度慢解决方法

    Mac 本搞Android开发,遇到Android SDK 下载速度慢,解决方法大概有两种.第一,FQ.这种方法比较彻底,但是要想有稳定的效果还的要花大价钱.第二,有些高人直接给了SDK中各软件的下载 ...

  5. cp 提示 overwrite 问题

    cp 提示 overwrite 问题 copy -f 文件的时候仍然提示覆盖问题,很诧异,咨询SA,果然 cp -i 强制要求覆盖文件的时候确认,-f 也不起作用,大大的不爽[root@erpappd ...

  6. Linux企业级项目实践之网络爬虫(21)——扩展为多任务爬虫

    高效的网络爬虫是搜索引擎的重要基础.采用多任务并发执行,实现类似于CPU的流水线(pipeline)运行方式,可极大地提高网络和计算资源的利用率等性能. #include "threads. ...

  7. paip.sql索引优化----join 代替子查询法

    paip.sql索引优化----join 代替子查询法 作者Attilax ,  EMAIL:1466519819@qq.com 来源:attilax的专栏 地址:http://blog.csdn.n ...

  8. SelectSort 选择排序

    //SelectSort (( O(n²))) public class TestSelectSort { public int[] selectSortArray(int[] arr){ int m ...

  9. Codeforces554C:Kyoya and Colored Balls(组合数学计算+费马小定理)

    题意: 有k种颜色,每种颜色对应a[i]个球,球的总数不超过1000 要求第i种颜色的最后一个球,其后面接着的必须是第i+1种颜色的球 问一共有多少种排法 Sample test(s) input o ...

  10. Android Studio编译好的apk放在哪里?

    Eclipse中编译好的apk文件时在bin文件中面的,可是在Android Studio有一个比較大的修改了,编译好的apk在android studio里面是直接看不到了,并且apk文件所在文件夹 ...