散列

PAT (Advanced Level) Practice 散列题

目录

  • 《算法笔记》 重点摘要
  • 1002 A+B for Polynomials (25)
  • 1009 Product of Polynomials (25)
  • 1084 Broken Keyboard (20)
  • 1092 To Buy or Not to Buy (20)
  • 1116 Come on! Let's C (20)
  • 1121 Damn Single (25)

《算法笔记》 4.2 散列 重点摘要

1. 散列

将元素通过一个函数转换为整数,使得该整数可以尽量唯一地代表这个元素。

2. 散列函数

一般直接用STL中的 map 或 unordered_map,除非必须模拟这些方法或对算法效率要求较高,否则不需要自己实现解决冲突的方法

(1) 直接定址法
  • 恒等变换:将 key(输入的数) 作为数组下标 ⭐——最常见最实用
  • 线性变换:H(key) = a * key + b
(2) 平方取中法 —— 很少用

取 key 平方的中间若干位作为 hash 值

(3) 除留余数法

H(key) = key % mod (表长Tsize >= mod,否则会越界)

  • 开放定址法

    • 线性探查法:H(key), H(key)+1, ...
    • 平方探查法:H(key), H(key)+1^2, H(key)-1^2, H(key)+2^2, H(key)-2^2, ...
      • if (H(key) + k^2 > Tsize) H(key)+k^2 % Tsize
      • if (H(key) - k^2 < 0) ((H(key) - k^2) % Tsize + Tsize) % Tsize (可只正向探查避免此种麻烦)
  • 链地址法

3. 字符串 hash

将一个字符串S映射为一个整数,使得整数可以尽可能唯一地代表字符串S

(1) 字符串由大写字母 A-Z 组成

将大写字母 A-Z 视为 0-25,即对应到了26进制中,再转换为10进制。转换为的整数最大为26^len-1,len为字符串长度

int hashFunc(char S[], int len){
int id = 0;
for (int i = 0; i < len; i++){
id = id * 26 + (S[i] - 'A');
}
return id;
}
(2) 字符串由大写字母 A-Z 和小写字母 a-z 组成

52进制转10进制问题

(3) 字符串由大写字母 A-Z,小写字母 a-z 和 数字 1-9 组成
  • (1) 62进制转10进制问题
  • (2) 若保证字符串末尾是确定个数的数字,可将前面英文字母部分转换为整数后将数字拼接上去
int hashFunc(char S[], int len){
int id = 0;
for (int i = 0; i < len - 1; i++){
id = id * 26 + (S[i] - 'A');
}
id = id * 10 + (S[len-1] - '0');
return id;
}

1002 A+B for Polynomials (25)

#include<iostream>
using namespace std;
int main()
{
int k, n, sum = 0;
double a, p[1001] = {0};
scanf("%d", &k);
for (int i = 0; i < k; i++){
scanf("%d%lf", &n, &a);
p[n] += a;
}
scanf("%d", &k);
for (int i = 0; i < k; i++){
scanf("%d%lf", &n, &a);
p[n] += a;
}
for (int i = 0; i < 1001; i++) if (p[i]) sum++;
printf("%d", sum);
for (int i = 1000; i >= 0; i--) if (p[i]) printf(" %d %.1f", i, p[i]);
return 0;
}

简化代码(参考柳婼小姐姐的代码

  • 和多项式可直接在输入时计算,不必分别存储两个多项式再相加。
  • 输出格式控制可将空格放在内容前面输出,这样不论检查到哪里输出尾部都不会有多余空格,不需要把不为 0 的单独放到 map 里集中输出
  • 简化前代码如下
#include<iostream>
#include<map>
using namespace std;
int main()
{
int k, n, sum = 0;
double a, p1[1002] = {0}, p2[1002] = {0}, p[1002] = {0};
scanf("%d", &k);
for (int i = 0; i < k; i++){
scanf("%d%lf", &n, &a);
p1[n] = a;
}
scanf("%d", &k);
for (int i = 0; i < k; i++){
scanf("%d%lf", &n, &a);
p2[n] = a;
}
for (int i = 0; i < 1002; i++) p[i] = p1[i] + p2[i];
map<int,double,greater<int>> p_map;
for (int i = 0; i < 1002; i++){
if (p[i]){
sum++;
p_map[i] = p[i];
}
}
printf("%d", sum);
for (auto it : p_map) printf(" %d %.1f", it.first, it.second);
return 0;
}

1009 Product of Polynomials (25)

题目思路

  • 先用两个数组分别将第一个多项式的指数和系数都接收进来,接收第二个时可以边接收边计算边保存结果。
  • 结果记录在一个大数组中,结果数组的索引即为结果多项式的指数,内容为此幂次的系数
  • 结果多项式有多少项需要遍历一次结果数组记录系数不为零的项数
  • 注意:因为相乘后指数可能最大为2000,所以ans数组最大要开到2001
#include<cstdio>
double result[2001] = {0};
int main()
{
int k1, k2, exp2;
double coe2;
scanf("%d", &k1);
int *exp1 = new int[k1];
double *coe1 = new double[k1];
for (int i = 0; i < k1; i++) scanf("%d%lf", exp1+i, coe1+i);
scanf("%d", &k2);
for (int i = 0; i < k2; i++){
scanf("%d%lf", &exp2, &coe2);
for (int j = 0; j < k1; j++)
result[exp1[j] + exp2] += coe1[j] * coe2;
}
int k = 0;
for (int i = 0; i < 2001; i++)
if (result[i] != 0) k++;
printf("%d",k);
for (int i = 2000; i >= 0; i--)
if (result[i] != 0)
printf(" %d %.1f", i, result[i]);
}

1084 Broken Keyboard (20)

参考思路(参考柳婼小姐姐的代码

  • 遍历原字符串,在打印的字符串中未出现的就是坏掉的
  • 只能输出一次,用集合记录输出过的。
#include<iostream>
#include<set>
using namespace std;
int main()
{
string a, b;
cin >> a >> b;
set<char> printed;
for (int i = 0; i < a.length(); i++){
if (b.find(a[i]) == b.npos && printed.find(toupper(a[i])) == printed.end()){
printf("%c", toupper(a[i]));
printed.insert(toupper(a[i]));
}
}
return 0;
}

简化代码

  • string 也可以用 find 查找字符,且由于每次插入前都检查是否已经出现,不会重复,可以用 string 替代 set 存储坏掉的字符
#include<iostream>
using namespace std;
int main()
{
string a, b, broken;
cin >> a >> b;
for (int i = 0; i < a.length(); i++)
if (b.find(a[i]) == b.npos && broken.find(toupper(a[i])) == broken.npos)
broken += toupper(a[i]);
cout << broken;
return 0;
}

题目思路

  • 字母出现过即意味着没有坏掉,若之前在 broken 集合中要 erase 掉
  • 遇到两字符串不匹配要检查是否在出现过的字母里,若不在就加到 broken 集合中
  • 输出时要按顺序且只能输出一次,用集合记录输出过的,遍历字符串,若在 broken 中且没有输出过就输出。
#include<iostream>
#include<set>
using namespace std;
int main()
{
string a, b;
cin >> a >> b;
int p = 0;
set<char> broken, okay, printed;
for (int i = 0; i < a.length(); i++){
if (a[i] == b[p]){
p++;
okay.insert(toupper(a[i]));
if (broken.find(toupper(a[i])) != broken.end()) broken.erase(toupper(a[i]));
}
else if (okay.find(toupper(a[i])) == okay.end()) broken.insert(toupper(a[i]));
}
for (int i = 0; i < a.length(); i++){
if (broken.find(toupper(a[i])) != broken.end() && printed.find(toupper(a[i])) == printed.end()){
printed.insert(toupper(a[i]));
printf("%c", toupper(a[i]));
}
}
return 0;
}

1092 To Buy or Not to Buy (20)

#include<iostream>
#include<map>
using namespace std;
int main()
{
map<char,int> shop;
string s, e;
cin >> s >> e;
for (int i = 0; i < s.length(); i++) shop[s[i]]++;
int miss = 0;
for (int i = 0; i < e.length(); i++){
if (shop.find(e[i]) != shop.end() && shop[e[i]] > 0) shop[e[i]]--;
else miss++;
}
if (!miss) printf("Yes %d", s.length()-e.length());
else printf("No %d", miss);
return 0;
}
  • 如果可以买,说明店主的珠子覆盖了想买的,则店主珠子数 - 想买珠子数 即为多余的
  • 简化前代码如下:去除了想买的珠子后剩下的店主珠子和,不必要再算一遍
#include<iostream>
#include<map>
using namespace std;
int main()
{
map<char,int> shop;
string s, e;
cin >> s >> e;
for (int i = 0; i < s.length(); i++) shop[s[i]]++;
int extra = 0, miss = 0;
for (int i = 0; i < e.length(); i++){
if (shop.find(e[i]) != shop.end() && shop[e[i]] > 0) shop[e[i]]--;
else miss++;
}
if (!miss){
for (auto it = shop.begin(); it != shop.end(); it++) extra += it->second;
printf("Yes %d", extra);
}
else printf("No %d", miss);
return 0;
}

1116 Come on! Let's C (20)

题目思路

  • 按顺序接收 ranklist 输入,将 id 和名次放入 map,由于只需要查询 id 对应的名次不需要排序,用 unordered_map 更快
  • 每次接收新的查询 id 先到 map 中查找是否在 ranklist 中,再到 set 中查找是否已经查询过。
  • 若未查询过,放入 set,再按照对应名次输出奖品。
  • 注意:不在 ranklist 输出优先级更高,若一个不在 ranklist 中的 id 之前被检查过,应当输出 Are you kidding? 而非 Checked,所以先查 map 后查 set
#include<unordered_map>
#include<iostream>
#include<set>
using namespace std;
bool isPrime(int n){
if (n <= 1) return false;
for (int i = 2; i * i <= n; i++)
if (n % i == 0) return false;
return true;
}
int main()
{
int n, k, id;
scanf("%d", &n);
unordered_map<int,int> rank;
for (int i = 0; i < n; i++){
scanf("%d", &id);
rank.insert({id,i+1});
}
set<int> checked;
scanf("%d", &k);
for (int i = 0; i < k; i++){
scanf("%d", &id);
if (rank.find(id) == rank.end()) printf("%04d: Are you kidding?\n", id);
else {
if (checked.find(id) != checked.end()) printf("%04d: Checked\n", id);
else {
checked.insert(id);
if (rank[id] == 1) printf("%04d: Mystery Award\n", id);
else if (isPrime(rank[id])) printf("%04d: Minion\n", id);
else printf("%04d: Chocolate\n", id);
}
}
}
return 0;
}
  • map.insert({key,value}) map 插入值可直接用 {} 括起来,省去写 pair 的麻烦

1121 Damn Single (25)

题目思路

  • 开大数组记录每个人的伴侣编号
  • 将受到邀请的客人全部放到一个 set 中,以便于后面查找一个客人的伴侣是否在场
  • 遍历 guests 集合,couple 数组对应值为 -1(无伴侣) 或 伴侣不在场的压入 vector
  • 有可能在场没有单身狗,要先检查 lonely 是否为空
  • lonely 不为空则对 lonely 排序后集中输出
#include<iostream>
#include<algorithm>
#include<vector>
#include<set>
using namespace std;
int couple[100000];
int main()
{
int n, m, a, b;
scanf("%d", &n);
fill(couple,couple+100000,-1);
for (int i = 0; i < n; i++){
scanf("%d%d", &a, &b);
couple[a] = b;
couple[b] = a;
}
scanf("%d", &m);
set<int> guests;
for (int i = 0; i < m; i++){
scanf("%d", &a);
guests.insert(a);
}
vector<int> lonely;
for (auto it = guests.begin(); it != guests.end(); it++)
if (couple[*it] < 0 || guests.find(couple[*it]) == guests.end()) lonely.push_back(*it);
if (lonely.empty()) printf("0\n");
else{
sort(lonely.begin(),lonely.end());
printf("%d\n%05d",lonely.size(), lonely[0]);
for (int i = 1; i < lonely.size(); i++) printf(" %05d",lonely[i]);
}
return 0;
}
  • memset(数组名, 值, sizeof(数组名); 在<cstring>中,建议只用来赋 0 或 -1
  • fill(first, last, value ); 在<algorithm>中,可将 first-last 范围内填充为 value 值
  • set.find (value); 在集合中查找 value 值,找到返回 iterator,否则返回 set::end.

PAT甲级 散列题_C++题解的更多相关文章

  1. PAT甲级 Dijkstra 相关题_C++题解

    Dijkstra PAT (Advanced Level) Practice Dijkstra 相关题 目录 <算法笔记>重点摘要 1003 Emergency (25) <算法笔记 ...

  2. PAT甲级 二叉树 相关题_C++题解

    二叉树 PAT (Advanced Level) Practice 二叉树 相关题 目录 <算法笔记> 重点摘要 1020 Tree Traversals (25) 1086 Tree T ...

  3. PAT甲级 二叉查找树 相关题_C++题解

    二叉查找树 PAT (Advanced Level) Practice 二叉查找树 相关题 目录 <算法笔记> 重点摘要 1099 Build A Binary Search Tree ( ...

  4. PAT甲级 字符串处理题_C++题解

    字符串处理题 目录 <算法笔记> 重点摘要 1001 A+B Format (20) 1005 Spell It Right (20) 1108 Finding Average (20) ...

  5. PAT甲级 图 相关题_C++题解

    图 PAT (Advanced Level) Practice 用到图的存储方式,但没有用到图的算法的题目 目录 1122 Hamiltonian Cycle (25) 1126 Eulerian P ...

  6. PAT甲级 树 相关题_C++题解

    树 目录 <算法笔记>重点摘要 1004 Counting Leaves (30) 1053 Path of Equal Weight (30) 1079 Total Sales of S ...

  7. PAT甲级 堆 相关题_C++题解

    堆 目录 <算法笔记>重点摘要 1147 Heaps (30) 1155 Heap Paths (30) <算法笔记> 9.7 堆 重点摘要 1. 定义 堆是完全二叉树,树中每 ...

  8. PAT甲级 排序题_C++题解

    排序题 PAT (Advanced Level) Practice 排序题 目录 <算法笔记> 6.9.6 sort()用法 <算法笔记> 4.1 排序题步骤 1012 The ...

  9. PAT甲级 链表题_C++题解

    链表处理 PAT (Advanced Level) Practice 链表题 目录 <算法笔记> 重点摘要:静态链表 1032 Sharing (25) 1052 Linked List ...

随机推荐

  1. エンジニア死滅シタ世界之学べない学校 [MISSION LEVEL: C]-Python3

    答案 # coding: utf-8 # 自分の得意な言語で # Let's チャレンジ!! N=input() w_a=0 w_b=0 gpc_dict={ "gg":0,&qu ...

  2. 本周JavaScript学习小结

    应组长杨老师号召,写个js阶段性学习小结. emmm这周学了Linux进程通讯,学正则表达式尝试完成第一次编程作业,中秋还去平潭露营(所以...js学得很少hhh). 现在还处于感性认识阶段,浏览了一 ...

  3. 手写一个MVVM

    最近看了珠峰的架构课——实现一个MVVM. 首先,我们来了解一下什么是MVVM. MVVM是Model-View-ViewModel的简写.它本质上就是MVC 的改进版.MVVM 就是将其中的View ...

  4. TP框架修改后台路径方法

      直接映射 admin 后台修改路径为 myadmin888       文章来源:外星人来地球 欢迎关注,有问题一起学习欢迎留言.评论

  5. https://en.wikipedia.org/wiki/Green_threads

    https://en.wikipedia.org/wiki/Green_threads

  6. DevOps时代的软件过程改进探讨 杨振涛 云加社区 今天 作者:杨振涛,腾讯云TVP 本文从Jenkins,DevOps,云原生等视角探讨了软件过程改进在各个时代的挑战和价值,重新审视了SPI在软件开发和交付的效率和质量提升方面的意义

    DevOps时代的软件过程改进探讨 杨振涛 云加社区 今天 作者:杨振涛,腾讯云TVP 本文从Jenkins,DevOps,云原生等视角探讨了软件过程改进在各个时代的挑战和价值,重新审视了SPI在软件 ...

  7. Tosca 注意事项(持续更新)

    #浏览器不能同时打开两个,不然不知道选哪个 #浏览器必须是100% 不能zoom in zoom out #浏览器 internet options 必须要配置,不然跑的很慢 照着这个配  https ...

  8. webSphere 部署项目时,访问报错:Error 500: javax.servlet.ServletException: SRVE0207E: Uncaught initialization exception created by servlet【我】

    前提: 一个普通maven项目,在本地用Tomcat运行没有任何问题,但是放到 webSphere  测试环境上,访问时就报如下错误: Error 500: javax.servlet.Servlet ...

  9. QML异常:Cannot anchor to an item that isn't a parent or sibling

    翻译: 无法定位到不是父项或同级项的项 QML的anchor必须定位父级对象或者同级对象,不能定位到其他如:同级对象的子对象

  10. Mysql读写分离(Mycat版)

    (1).读写分离概述 1)工作原理 读写分离是让主数据库处理事务性增删改操作(insert.delete.update),让从数据库处理查询查询操作(select). 2)作用 1.分担负载 2.主从 ...