Ruby中Hash哈希结构的基本操作方法小结_Ruby

关于哈希
先来了解一下Hash的基本思路：
设要存储对象的个数为num, 那么我们就用len个内存单元来存储它们(len>=num); 以每个对象ki的关键字为自变量，用一个函数h(ki)来映射出ki的内存地址，也就是ki的下标，将ki对象的元素内容全部存入这个地址中就行了。这个就是Hash的基本思路。
为什么要用一个函数来映射出它们的地址单元呢？
假设现在我要存储4个元素 13 7 14 11
显然，我们可以用数组来存。也就是：a[1] = 13; a[2] = 7; a[3] = 14; a[4] = 11;
当然，我们也可以用Hash来存。下面给出一个简单的Hash存储：
先来确定那个函数。我们就用h(ki) = ki%5;
对于第一个元素 h(13) = 13%5 = 3; 也就是说13的下标为3；即Hash[3] = 13;
对于第二个元素 h(7) = 7 % 5 = 2; 也就是说7的下标为2; 即Hash[2] = 7;
同理，Hash[4] = 14; Hash[1] = 11;
现在我要你查找11这个元素是否存在。你会怎么做呢？当然，对于数组来说，那是相当的简单，一个for循环就可以了。
也就是说我们要找4次。
下面我们来用Hash找一下。
首先，我们将要找的元素11代入刚才的函数中来映射出它所在的地址单元。也就是h(11) = 11%5 = 1了。下面我们来比较一下Hash[1]?=11, 这个问题就很简单了。也就是说我们就找了1次。这个就是Hash的妙处了，通过制定一个规则（函数）来映射出它的地址，数据也就能通过这个规则去找到它的内存地址了。

Ruby中的Hash结构
1.创建哈希：就像创建数组一样，我们可以通过Hash类来创建一个Hash实例:

				?

									h1 = Hash.new                         #默认值为nil

									h2 = Hash.new(“This is my first hash instance”) #默认值为” This is my first hash instance”:

上面两个例子都创建了一个空的Hash实例。一个Hash对象总是有一个默认的值——因为如果在一个Hash对象里没有找到指定的索引（key），将会返回默认值。
创建了Hash对象后，我们就可以像数组那样给他添加/删除项了。唯一不同的是，在数组中的索引只是能整数，而在Hash中索引（key）可以是任何类型（any type of object）且唯一的数据：

				?

									h2["one"] = "北京"

									h2["two"] = "上海"

									h2["three"] = "深圳"

									h2["four"] = "广州"

Note: 如果在给Hash赋值时，使用的相同的key，那么后面的值会覆盖掉前面的值。另外，Ruby还提供了一种方便的创建和初始化Hash的方法，只需要在key后面加一个=>符号并跟一个值即可。每个key-value对用逗号隔开。然后整体用大括号括起来：

				?

									h2 = {

									"one" => "北京",

									"two" =>"上海",

									"three" =>"深圳",

									"four" =>"广州"

									}

2.通过索引存取Hash的值：
要想获取某个值，可以用下面的方法：

				?

									puts h2[“one”]       #=>”北京”

如果指定的key不存在，将返回默认的值（前面有提到过）。此外，我们还可以用default方法获取默认值，用default+=方法设置默认值

				?

									puts h1.default

									h1.default += “This is set value method”

3.复制Hash：
和数组一样，我们可以把一个Hash变量分配给另一个hash变量，它们都引用想同的Hash，所以如果其中一个的值变了，那么另外一个的值也会跟着变：

				?

									h3 = h2

									h3[“one”] = “西安”

									puts h h2[“one”]        #=>”西安”

有的时候我们不希望上面的情况发生，即：修改了其中一个的值另一个也跟着修改了，我们可以使用clone方法make a new

				?

									copy

									    h4 = h2.clone

									    h4[“one”] = “大连”

									    puts h2[“one”]              #=>”西安”（i.e. 值没有修改）

4.Hash排序:
当我们需要对Hash进行排序时，不能像数组那样简单的使用sort方法，因为数组中的数据类型都是一样的（整型），Hash中的数据类型可能并不完全一样，如整数类型和字符串类型就没法一起排序，此时就需要我们进行处理，如下（如果Hash中的数据类型全部相同可以不进行如下处理）：

				?

									def sorted_hash(aHash)

									       return aHash.sort{

									           |a,b| a.to_s <=> b.to_s           

									       }

									    End

									h1 = {1=>'one', 2=>'two', 3=> 'three'}

									h2 = {6=>'six', 5=>'five', 4=> 'four'}

									h3 = {'one'=>'A', 'two'=>'B','three'=>'C'}

									h4 = h1.merge(h2)           #合并hash

									h5 = h1.merge(h3)

									def sorted_hash(aHash)

									  return aHash.sort{|a,b| a.to_s <=> b.to_s }

									end

									p(h4)          

									p(h4.sort)

									p(h5)

									p(sorted_hash(h5))

结果：

				?

									{5=>"five", 6=>"six", 1=>"one", 2=>"two", 3=>"three", 4=>"four"}

									[[1, "one"], [2, "two"], [3, "three"], [4, "four"], [5, "five"], [6, "six"]]

									{"two"=>"B", "three"=>"C", 1=>"one", 2=>"two", "one"=>"A", 3=>"three"}

									[[1, "one"], [2, "two"], [3, "three"], ["one", "A"], ["three", "C"], ["two", "B"]]

事实上Hash的sort方法是把一个Hash对象转换成以［key，value］为单个元素的一个数组，然后再用数组的sort方法进行排序。

5.Hash类常用方法：

方法	说明
size()	返回Hash对象的长度
length()	返回Hash对象的长度
include?(key)	判断指定的Hash对象是否包含指定的key
has_key?(key)	判断指定的Hash对象是否包含指定的key
delete(key)	删除Hash对象中指定key的对应元素
keys()	返回由Hash对象中全部key组成的数组
values()	返回由Hash对象中全部value组成的数组

e.g.

				?

									student = {

									        "name" => "Steve",

									        "age" => 22,

									        "Gender" => "male"

									       }   

									  p student.keys                           #=> ["name", "Gender", "age"]

									  p student.values                       　#=> ["Steve", "male", 22]

									  puts student.include?("age")              　 #=> true

									  puts student.size                          #=> 3

									  student.delete("Gender")

									  puts student.has_key?("Gender")              #=>false

									  puts student.size                          #=>2

深度挖掘
1.把Hash当作数组来处理：
Hash中的keys and values方法的返回值都是一个数组，所以我们可以使用数组的方法来对它们操作：

				?

									h1 = {1=>'one', 2=>'two', 3=> 'three',4=> 'four'}

									h2 = {1=>'one', 3=>'two', 4=> 'four',5=> 'five'}

									p( h1.keys & h2.keys )

									p( h1.values & h2.values )

									p( h1.keys+h2.keys )

									p( h1.values-h2.values )

									p( (h1.keys << h2.keys) )

									p( (h1.keys << h2.keys).flatten)

结果：

				?

									[1, 3, 4]

									["one", "two", "four"]

									[1, 2, 3, 4, 5, 1, 3, 4]

									["three"]

									[1, 2, 3, 4, [5, 1, 3, 4]]

									[1, 2, 3, 4, 5, 1, 3, 4]

2.追加和连续的区别：
+：给一个数组添加元素，创建一个新的数组
<<：给一个数据添加元素，直接操作原数组，当给一个数组添加的新元素也是一个数组时,该新元素作为数组的最后一个元素：

				?

									a=[1,2,3]

									b=[4,5,6]

									p(a+b)

									p(a<<b)

结果：

				?

									[1, 2, 3, 4, 5, 6]

									[1, 2, 3, [4, 5, 6]]     #[1, 2, 3, [4, 5, 6]].flatten =>[1, 2, 3, 4, 5, 6]

Ruby中Hash哈希结构的基本操作方法小结

延伸 · 阅读

Ruby环境下安装使用bundler来管理多版本的gem

剖析 Ruby 访问控制

Ruby迭代器的7种技巧分享

Ruby设计模式编程中使用Builder建造者模式的实例

Ruby简洁学习笔记（一）:字符串、数字、类和对象

简要说明Ruby中的迭代器

Ruby进行文件信息输出实例代码

CentOS中配置Ruby on Rails环境

举例初步讲解Ruby中的正则表达式

Windows下Ruby on Rails开发环境安装配置图文教程