iOS编程当中的几个集合类:NSArray,NSDictionary,NSSet以及对应的Mutable版本,应该所有人都用过。只是简单使用的话,相信没人会用错,但要做到高效(时间复杂度)精确(业务准确性),还需要了解其中所隐藏的算法知识。

在项目当中使用集合类几乎是不可避免的,集合类的使用场景其实可以进行抽象的归类。大多数时候我们需要将若干个对象(object)暂时保存起来,以备后续的业务逻辑进行操作,「保存和操作」,或者说「存与取」,对应到计算机世界的术语就是读和写。最初保存的时候我们Insert,下次进行更新的时候我们再Get,不再需要的时候我们调用Delete,所以你看集合类的操作场景其实就那么多,关键在于我们存的方式,和取的方式不同。

最初我们学习数据结构和算法的时候,知道数据的组织方式不同,比如Array, List, Stack, Heap, Tree,其对应的读和取效率(时间复杂度)也不同。如果insert的效率高,下次get的时候效率就低,比如无序的Array,插入的时候O(1),查找的时候就变O(N)。如果想要查找的速度快,比如排序过的Array,查找的速度在O(logN),插入的时候就必须要保持Array有序这一特性O(N)。所以插入和查找是鱼与熊掌,想要下次快速的找到一本书,就必须在整理书架的时候多花些心思分门别类。或者我们跳出时间的维度,用更多的空间来做弥补,使用哈希表或者Dictionary来存储数据,查找的速度可以快至O(1),缺点是牺牲了更多的空间。

当我们预先存好Array之后,使用的时候大多是以下几种场景:

场景一

1
2
3
for (NSObject* obj in self.arr) {
    //update each object
}

场景二

1
2
3
if ([self.arr containsObject:obj] == false) {
    [self.arr addObject:obj];
}

场景三

1
2
3
if ([self.arr containsObject:obj] == true) {
    [self.arr removeObject:obj];
}

第一种场景没有多少可发掘的,一次干净利索的遍历费时O(N)。唯一需要注意的是切忌在遍历的时候改变集合对象,比如:

1
2
3
4
5
for (NSObject* obj in self.arr) {
    if(obj.isInvalid){
        [self.arr removeObject:obj];
    }
}

如果要在遍历的时候删除可以换种写法,比如:

1
2
3
4
5
6
for (int i = self.arr.count-1; i > 0; i --) {
    NSObject* obj = self.arr[i];
    if (obj.isInvalid) {
        [self.arr removeObject:obj];
    }
}

场景二和场景三需要特别留意,containsObject,removeObject都涉及到一个集合当中的重要概念,即相等性。

值的相等性很简单,不用思索就能得出直观的答案,比如1==1,2.0f==2.0f。

对象的相等性就不那么简单了。什么时候我们认为两个对象是相等的呢?我们可以从两个维度去理解相等性。

同一对象相等:

理论上说两个对象的指针如果是指向同一块内存区域,那么他们一定是相等的,一定是指向同一个对象。这种情况下我们判断相等性是通过

1
if (obj1 == obj2)

业务属性相等:

两个对象即使不指向同一块内存区域,但他们的所有(或者部分关键的)property是相等的,我们也可以认为这两个对象是相等的,比如连个UserProfile对象,他们的name,gener,age属性都相等,在业务层面,我们可以认为他们是相等的,此时我们不能用==来判断相等性了,需要重载isEqual,或者自己实现isEqualToXXX:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
@implementation MyObject
- (BOOL)isEqual:(id)object
{
    if (self == object) {
        return true;
    }
    if ([object isKindOfClass:[self class]] == false) {
        return false;
    }
     
    MyObject* myObject = object;
    if ([self.name isEqualToString:myObject.name]) {
        return true;
    }
     
    return false;
}
@end

所以当我们判断两个集合当中对象是否相等时,一定要心中明确是那种相等。当调用containsObject,removeObject的时候,如果我们重载了isEqual,系统就通过我们的isEqual方法来判断相等性,如果没有重载,那么系统就会通过判断内存地址来判断相等性了。

有些架构model layer的设计会允许同一个业务对象在应用层存在多份拷贝,此时在Array当中使用相等性的时候尤其要注意重载isEqua方法。当然有些mode layer只允许一份拷贝,一个业务对象永远只对应一个内存地址,isEqual方法就变得多余了。

和isEqual配套的另一个方法hash也经常被提起,官方文档甚至规定isEqual和hash必须被同时实现。学习过hash表之后,我们知道如果两个对象业务上相等,那么他们的hash值一定是相等的,hash方法的用处还是在于判断相等性,系统默认的hash方法实际上返回的就是对象的内存地址。问题是我们已经有isEqual方法来判断相等性了,为什么还需要一个hash呢?

答案是hash可以更加高效快速的判断一个对象是否存在集合当中,在NSArray当中我们需要遍历Array,调用N次isEqual才能知道对象是否存在集合当中,时间复杂度是O(N)。在调用isEqual之前,可以通过调用hash来判断是否相等,如果hash值不等就没有进一步调用isEqual的必要了,如果相等必须再调用一次isEqual来确认是否真正相等。但是hash为什么会比isEqual的效率要高呢?看下hash的声明就明白了。

1
2
3
4
- (NSUInteger)hash
{
    return [_name hash];
}

hash方法的返回值是一个NSUInteger,这个值往往和对象在内存当中的存储位置直接相关,也就是说我们可以通过这个值以O(1)的复杂度快速读取到某个对象来判断相等性,和Array O(N)的复杂度相比快了太多了,Array显然不具备这种特性,Array当中的元素是在一片内存空间当中连续排放的,和hash的返回值没任何关系。

但这种使用hash的便捷性有一个前提:对象在集合当中是唯一的,也就是说集合当中不允许存在重复的元素,比如NSDictionary,NSSet。我们在使用下列方法的时候:

1
2
[dictionary objectForKey:key];
[set addObject:object];

为了保证唯一性,都需要先判断对象是否存在集合当中,此时一个高效的判断机制十分重要,这也就是hash发挥作用的地方,这也是为什么使用NSArray的时候只会调用isEqual,而使用NSDictionary,NSSet的时候会频繁调用hash的原因。

所以当我们使用NSDictionary,NSSet的时候,同时重载isEqual和hash方法对性能至关重要。hash方法的选择并不需要过分挑剔,对关键的property做下运算,保证绝大部分场景下hash值不同即可,毕竟hash调用之后还是会调用isEqual做进一步判断,并不会对我们业务的准确性产生影响。

Objective C当中的几个关键集合类:NSArray,NSDictionary,NSSet要高效的使用并没有看起来那么简单,当集合类中的元素到达一定量级之后,考虑下背后的算法效率很有必要,这也是为什么一直强调算法对于程序员的重要性。

一些NSArray,NSDictionary,NSSet相关的算法知识的更多相关文章

  1. [转]一些NSArray,NSDictionary,NSSet相关的算法知识

    iOS编程当中的几个集合类:NSArray,NSDictionary,NSSet以及对应的Mutable版本,应该所有人都用过.只是简单使用的话,相信没人会用错,但要做到高效(时间复杂度)精确(业务准 ...

  2. Fouandation(NSString ,NSArray,NSDictionary,NSSet) 中常见的理解错误区

    Fouandation 中常见的理解错误区 1.NSString //快速创建(实例和类方法) 存放的地址是 常量区 NSString * string1 = [NSString alloc]init ...

  3. 遍历NSArray, NSDictionary, NSSet的方法总结

    1,for循环读取 NSArray: NSArray *array = /*…*/ ; i<array.count; i++) { id object = array[i]; // do sth ...

  4. [翻译] 用 ObjectiveSugar 扩展NSArray NSDictionary NSSet NSNumber

    source - https://github.com/supermarin/ObjectiveSugar Look like a girl, act like a lady, think like ...

  5. Read and Write NSArray, NSDictionary and NSSet to a File

    查询地址:http://iosdevelopertips.com/data-file-management/read-and-write-nsarray-nsdictionary-and-nsset- ...

  6. Xcode4.4(LLVM4.0编译器)中NSArray, NSDictionary, NSNumber优化写法

    Xcode4.4(LLVM4.0编译器)中NSArray, NSDictionary, NSNumber优化写法 从xcode4.4开始,LLVM4.0编译器为Objective-C添加一些新的特性. ...

  7. NSData NSDate NSString NSArray NSDictionary 相互转换

    // NSData NSDate NSString NSArray NSDictionary json NSString *string = @"hello word"; NSDa ...

  8. 尚学linux课程---9、yum相关操作和知识

    尚学linux课程---9.yum相关操作和知识 一.总结 一句话总结: 如何使用比如163,阿里云给yum配置yum源:去官网,不要百度:直接去官网,有帮助文档的(比如centos的就在centos ...

  9. NSData NSDate NSString NSArray NSDictionary 相互转化

    //    NSData  NSDate NSString NSArray NSDictionary json NSString *string = @"hello word"; ...

随机推荐

  1. vmware workstation9.0 RHEL5.8 oracle 10g RAC安装指南及问题总结

    一,虚拟机规划 (1)虚拟机:添加三块网卡 eth0 eth1 eth2 ,分别用于内网,心跳,外网RAC1 内网:192.168.1.10/24  心跳:192.168.2.10/24  VIP:1 ...

  2. 联合体(union)的使用方法及其本质

    转自:http://blog.csdn.net/huqinwei987/article/details/23597091 有些基础知识快淡忘了,所以有必要复习一遍,在不借助课本死知识的前提下做些推理判 ...

  3. HDU 5769 Substring 后缀数组

    Substring Problem Description ?? is practicing his program skill, and now he is given a string, he h ...

  4. 常用CSS居中

    1.flex方法: .center_fix { display:flex; align-items:center; justify-content: center; } 具体flex方法教程:可以参见 ...

  5. 【Spring】获取资源文件+从File+从InputStream对象获取正文数据

    1.获取资源文件或者获取文本文件等,可以通过Spring的Resource的方式获取 2.仅有File对象即可获取正文数据 3.仅有InputStream即可获取正文数据 package com.sx ...

  6. 新的篇章--Python

    这周已经开始Python的学习了,感觉Python类似于Powershell, 但又有不同点.在此总结一下新学到的资料: 简单的使用变量的方法: name= input("input you ...

  7. 深入分析@Transactional的用法

    关键词:事务, 编程式事务,声明式事务.spring 事务管理.AOP事务增强.@Transactional 在分析深入分析@Transactional的使用之前,我们先回顾一下事务的一些基本内容. ...

  8. 数据结构之KMP算法next数组

    我们要找到一个短字符串(模式串)在另一个长字符串(原始串)中的起始位置,也就是模式匹配,最关键的是找到next数组.最简单的算法就是用双层循环来解决,但是这种算法效率低,kmp算法是针对模式串自身的特 ...

  9. EntityFrame CodeFirst 自动生成表

    来源:http://msdn.microsoft.com/zh-cn/data/jj193542 本视频和分步演练介绍通过 Code First 开发建立新数据库.这个方案包括建立不存在的数据库(Co ...

  10. 【BZOJ】3751: [NOIP2014]解方程

    题意 求\(\sum_{i=0}^{n} a_i x^i = 0\)在\([1, m]\)内的整数解.(\(0 < n \le 100, |a_i| \le 10^{10000}, a_n \n ...