个人的一些碎碎念: 聚类,直觉就能想到kmeans聚类,另外还有一个hierarchical clustering,但是单细胞里面都用得不多,为什么?印象中只有一个scoring model是用kmean进行粗聚类.(10x就是先做PCA,再用kmeans聚类的) 鉴于单细胞的教程很多,也有不下于10种针对单细胞的聚类方法了. 降维往往是和聚类在一起的,所以似乎有点难以区分. PCA到底是降维.聚类还是可视化的方法,t-SNE呢? 其实稍微思考一下,PCA.t-SNE还有下面的diffusion…
其实就是另一种形式的打分. 个人点评这种方法: 这篇文章发表在nature上,有点奇怪,个人感觉创新性和重要性还不够格,工具很多,但是本文基本都是自己开发的算法(毕竟satji就是搞统计出身的). 但是仔细看了代码之后,发现这些方法确实是有点artificial! 而且算法原创性不高,多半是基于现有的一些工具的二次开发. Identifying a maturation trajectory. To assign each cell a maturation score that is prop…
The normalization method described above aims to reduce the effect of technical factors in scRNA-seq data (primarily, depth) from downstream analyses. However, heterogeneity in cell cycle stage, particularly among mitotic cells transitioning between…
机器学习问题可能包含成百上千的特征.特征数量过多,不仅使得训练很耗时,而且难以找到解决方案.这一问题被称为维数灾难(curse of dimensionality).为简化问题,加速训练,就需要降维了. 降维会丢失一些信息(比如将图片压缩成jpeg格式会降低质量),所以尽管会提速,但可能使模型稍微变差.因此首先要使用原始数据进行训练.如果速度实在太慢,再考虑降维. 8.1 维数灾难(The Curse of Dimensionality) 我们生活在三维空间,连四维空间都无法直观理解,更别说更高…
作为网络开发人员,使用fiddler无疑是最好的选择,方便易用功能强. 但是什么作为爱学习的同学,是不应该止步于http协议的,学习wireshark则可以满足这方面的需求.wireshark作为抓取各种底层协议的包有着强大的功能,用于网络排错或者一些其他通讯方面的查看,是必须的. 以前有自己看过wireshark相关的简要教程,也是一知半解.借助<Wireshark数据包分析实战>一书,更准确知晓wireshark到底能干啥吧! 1. 网络七层协议(老生长谈了,看过许许多多的书,都会提到的一…
前言 上篇文章中讲到,在智能电网的控制与管理侧中,数据的分析和挖掘.可视化等工作属于核心环节.除此之外,二次侧中需要对数据进行采集,数据共享平台的搭建显然也涉及到数据的管理.那么在智能电网领域中,数据工程到底是如何实施的呢? 本文将以IBM的Itelligent Utility Network产品为例阐述智能电网中的数据工程,它是IBM声称传统电网向智能电网转变的整体方案(看过上篇文章的童鞋想必会清楚这样的说法是片面狭隘的,它只能算是智能电网中的数据工程). 另一方面,如今是一个数据爆炸的时代,…
本文转自知乎 作者:苏格兰折耳喵 ----------------------------------------------------- 在本文中,作者引出了"外部数据"这一概念,并实例分析,如何从海量的外部数据中获取可以对自身业务起到指导作用和借鉴意义的insight,并借助外部环境数据来优化自己. 现在互联网上关于"增长黑客"的概念很火,它那"四两拨千斤"."小投入大收益"的神奇法力令无数互联网从业者为之着迷.一般来说…
Wireshark简介: Wireshark是一款最流行和强大的开源数据包抓包与分析工具,没有之一.在SecTools安全社区里颇受欢迎,曾一度超越Metasploit.Nessus.Aircrack-ng等强悍工具.该软件在网络安全与取证分析中起到了很大作用,作为一款网络数据嗅探与协议分析器,已经成为网络运行管理.网络故障诊断.网络应用开发与调试的必用工具. 上面是wireshark的主窗口,分三大主块:Packlist List(数据包列表).Packet Details(数据包细节).Pa…
本文转载至http://blog.csdn.net/lixing333/article/details/7782539 iosiphone网络filter工具 我在另外一篇博客里,介绍了一款比Wireshark更轻量.更好用的软件:Charles: http://blog.csdn.net/lixing333/article/details/42776187 今天闲的没事干,想试着分析iOS应用的网络数据传输方式.以前就曾经想过这么做,但是由于无法得到iPhone的联网数据,一直没成功.今天尝试…
存个代码,以后参考. numpy次成分分析和PCA降维 SVD分解做次成分分析 原图: 次成分复原图: 代码: import numpy as np from numpy import linalg import cv2 as cv src = cv.imread("/home/xueaoru/图片/output_3_0.png") gray = cv.cvtColor(src,cv.COLOR_BGR2GRAY) S,V,D = linalg.svd(gray) vv = np.ze…