[leetcode]187. Repeated DNA Sequences寻找DNA中重复出现的子串

很重要的一道题

题型适合在面试的时候考

位操作和哈希表结合

public List<String> findRepeatedDnaSequences(String s) {

        /*

        寻找出现过一次以上的十个字母长的子串

        最简单的想法是把每个长度为10的子串存到hashtable中，但是这肯定不符合出题人的意思，要考察位操作

        看了答案，使用位操作，第一次做bit manipulation的题

        由于A\C\G\T的ASCII码，后三位各不相同，所以我们只要考虑字符的后三位就行

        用一个int类型来代表遍历序列，每次把一个字符添加到序列末尾（添加方式是左移3位然后|上下一个字符的后三位）

        这样每次用一个掩码提取后27位并|后一位字符代表当前子串，记录到hashtable中，这样用一个int数字代替一个子串，

        会节省内存

        这里不直接提取后30位的原因是，如果提取30位再向左移3位会超出int范围，而且32位计算机会溢出

        所以先提取27位再左移再或

         */

        int l = s.length();

        List<String> res = new ArrayList<>();

        if(l<=10)

        {

            return res;

        }

        Map<Integer,Integer> map = new HashMap<>();

        //位操作序列

        int cur = 0;

        //掩码1,用来提取后27位

        int mask = 0x7ffffff;

        //先把前27位添加上，以后就可以循环实现了

        for (int i = 0; i < 9; i++) {

            //每次左移3位，空出位置用于添加，&7是提取后三位

            cur  = (cur<<3)|(s.charAt(i)&7);

        }

        //开始记录和查询

        for (int i = 9; i < l; i++) {

            cur = ((cur&mask)<<3)|(s.charAt(i)&7);

            map.put(cur,map.getOrDefault(cur,0)+1);

            //只在第二次出现时添加，第三次，第四次...不添加

            //一开始想着全部添加到map中在遍历key来添加，但是发现那时候就没有字符index：i了，如果用key还原子串很麻烦

            if (map.get(cur)==2)

                res.add(s.substring(i-9,i+1));

        }

        return res;

        }

[leetcode]187. Repeated DNA Sequences寻找DNA中重复出现的子串的更多相关文章

[LeetCode] 187. Repeated DNA Sequences 解题思路
All DNA is composed of a series of nucleotides abbreviated as A, C, G, and T, for example: "ACG ...
[LeetCode] 187. Repeated DNA Sequences 求重复的DNA序列
All DNA is composed of a series of nucleotides abbreviated as A, C, G, and T, for example: "ACG ...
leetcode 187. Repeated DNA Sequences 求重复的DNA串 ---------- java
All DNA is composed of a series of nucleotides abbreviated as A, C, G, and T, for example: "ACG ...
Java for LeetCode 187 Repeated DNA Sequences
All DNA is composed of a series of nucleotides abbreviated as A, C, G, and T, for example: "ACG ...
[LeetCode#187]Repeated DNA Sequences
Problem: All DNA is composed of a series of nucleotides abbreviated as A, C, G, and T, for example: ...
leetcode 26 80 删除已排序数组中重复的数据
80. Remove Duplicates from Sorted Array II Follow up for "Remove Duplicates":What if dupli ...
LeetCode-Repeated DNA Sequences (位图算法减少内存)
Repeated DNA Sequences All DNA is composed of a series of nucleotides abbreviated as A, C, G, and T, ...
LeetCode 187. 重复的DNA序列(Repeated DNA Sequences)
187. 重复的DNA序列 187. Repeated DNA Sequences 题目描述 All DNA is composed of a series of nucleotides abbrev ...
lc面试准备:Repeated DNA Sequences
1 题目 All DNA is composed of a series of nucleotides abbreviated as A, C, G, and T, for example: &quo ...

随机推荐

虚拟机VM15 Ubuntu18.04写第一个c程序并实现ssh连接
输入"su",再输入密码进入根用户 1.开启ssh服务 /etc/init.d/ssh start 若没有安装会出现: (1).安装ssh apt-get install open ...
win10 下安装 ubuntu 子系统的完全指北
最近在搞 C++ 相关的东西,因为在 Linux 下开发会比较流畅舒适,而公司配的电脑都是 windows 的,之前都是在 vmware 中安装个 ubuntu 虚拟机,但这种有时候比有点卡顿.所以今 ...
CenOS下载离线依赖包神器--yumdownloader
Blog:博客园个人本文只总结一些常用的用法,更详细的说明见man yumdownloader和 info yumdownloader. 概述有时候所在服务器环境不能访问外网,yum安装会感到非 ...
Centos7安装Kubernetes k8s v1.16.0 国内环境
一. 为什么是k8s v1.16.0? 最新版的v1.16.2试过了,一直无法安装完成,安装到kubeadm init那一步执行后,报了很多错,如:node xxx not found等.centos ...
badboy下载
最近新接触了badboy软件,以下是百度网盘链接,有需要可以下载. 链接:https://pan.baidu.com/s/1O4oIhx-twcaMA_fDzRQPHg提取码:7i44 二维码:
孪生网络入门（上） Siamese Net及其损失函数
最近在多个关键词(小数据集,无监督半监督,图像分割,SOTA模型)的范畴内,都看到了这样的一个概念,孪生网络,所以今天有空大概翻看了一下相关的经典论文和博文,之后做了一个简单的案例来强化理解.如果需要 ...
从Paxos到Zookeeper 分布式一致性原理与实践读书心得
一本书作者介绍此书名为从Paxos到ZooKeeper分布式一致性原理与实践,作者倪超,阿里巴巴集团高级研发工程师,国家认证系统分析师,毕业于杭州电子科技大学计算机系.2010年加入阿里巴巴中间件 ...
PyQt（Python+Qt）学习随笔：QMainWindow的tabifyDockWidget方法将QDockWidget两个停靠窗选项卡式排列
专栏:Python基础教程目录专栏:使用PyQt开发图形界面Python应用专栏:PyQt入门学习老猿Python博文目录主窗口的tabifyDockWidget方法用于将主窗口的两个停靠窗口 ...
第15.34节 PyQt(Python+Qt)入门学习：containers容器类部件QStackedWidget堆叠窗口部件详解
老猿Python博文目录专栏:使用PyQt开发图形界面Python应用老猿Python博客地址一.概述 StackedWidget堆叠窗口部件为一系列窗口部件的堆叠,对应类为QStackedWi ...
PyQt（Python+Qt）学习随笔：怎么在QScrollArea滚动区域中展示子部件的超长内容？
老猿Python博文目录专栏:使用PyQt开发图形界面Python应用老猿Python博客地址滚动区域可以针对部署在其上的子部件在不可见时进行滚动展示,但这种滚动展示仅只能展示内容层可见范围的子 ...

[leetcode]187. Repeated DNA Sequences寻找DNA中重复出现的子串

[leetcode]187. Repeated DNA Sequences寻找DNA中重复出现的子串的更多相关文章

随机推荐

热门专题