Update 3.决策树.md

DataMonk2017 · web-flow · commit 62b939a8cf93 · 2018-02-01T01:18:01.000-08:00
diff --git a/docs/3.决策树.md b/docs/3.决策树.md
@@ -38,13 +38,13 @@
 
 #### 信息熵 & 信息增益
 
-熵：
-熵（entropy）指的是体系的混乱的程度，在不同的学科中也有引申出的更为具体的定义，是各领域十分重要的参量。
+熵（entropy）：
+熵指的是体系的混乱的程度，在不同的学科中也有引申出的更为具体的定义，是各领域十分重要的参量。
 
 信息论（information theory）中的熵（香农熵）：
 是一种信息的度量方式，表示信息的混乱程度，也就是说：信息越有序，信息熵越低。例如：火柴有序放在火柴盒里，熵值很低，相反，熵值很高。
 
-信息增益：
+信息增益（information gain）：
 在划分数据集前后信息发生的变化称为信息增益。
 
 ### 决策树 工作原理
@@ -55,7 +55,7 @@
 ```
 def createBranch():
 '''
-此处运用了迭代的思想。 感兴趣的以搜索 迭代 recursion， 甚至是 dynamic programing。
+此处运用了迭代的思想。 感兴趣可以搜索 迭代 recursion， 甚至是 dynamic programing。
 '''
     检测数据集中的所有数据的分类标签是否相同:
         If so return 类标签
@@ -76,7 +76,7 @@ def createBranch():
 分析数据：可以使用任何方法，构造树完成之后，我们应该检查图形是否符合预期。
 训练算法：构造树的数据结构。
 测试算法：使用训练好的树计算错误率。
-使用算法：此步骤可以适用于任何监督学习人物，而使用决策树可以更好地理解数据的内在含义。
+使用算法：此步骤可以适用于任何监督学习任务，而使用决策树可以更好地理解数据的内在含义。
 ```
 
 ### 决策树 算法特点
@@ -109,7 +109,7 @@ def createBranch():
 分析数据：可以使用任何方法，构造树完成之后，我们可以将树画出来。
 训练算法：构造树结构
 测试算法：使用习得的决策树执行分类
-使用算法：此步骤可以适用于任何监督学习算法，而使用决策树可以更好地理解数据的内在含义
+使用算法：此步骤可以适用于任何监督学习任务，而使用决策树可以更好地理解数据的内在含义
 ```
 
 > 收集数据：可以使用任何方法
@@ -202,6 +202,7 @@ def splitDataSet(dataSet, index, value):
             print music_media
             #结果：
             #[1, 2, 3, [4, 5, 6]]
+            
             music_media.extend([7,8,9])
             print music_media
             #结果：