2811-林同学-算法方向-数据挖掘-就业:是 扫二维码继续学习 二维码时效为半小时

(0评价)
价格: 免费

tf idf

tf:term frenquency词的频率 出现的次数

idf:inverse document frequency 逆文档频率

log(总文档数量/该词出现的文档数量)

 

重要性程度

 

[展开全文]

countvectorizer没有参数

文本都是放在列表里面的可迭代对象

[展开全文]

性能瓶颈,读取速度

格式不太符合机器学习要求数据的格式

 

可用数据集:

Kaggle

UCI

scikit-learn

 

 

[展开全文]

机器学习是从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测

1. 解放生产力

2.解决专业问题

3.提供社会便利

[展开全文]

递归函数阶乘计算

def factorial(n):

if n ==1:

    return 1

else:

    return n*factorial(n-1)

result = factorial(5)

print(5)

[展开全文]

递归函数

递归函数,类似于数学归纳法。

每个递归函数必须包含两个部分:

1.终止条件

2.递归步骤

栈先进后出

[展开全文]

eval()函数

执行一个字符串

eval(source[,globals[,locals]])

globals:可选,必须是字典

locals:可选,任意映射对象

[展开全文]

lambda表达式

lambda表达式可以用来声明匿名函数。只允许包含一个表达式,不能包括复杂语句。该表达式的计算结果就是函数的返回值。

lambda 形参1,形参2,形参3: <表达式>

运算结果是表达式的运算结果

f= lambda a,b,c:a+b+c

print(f(2,3,4))

 

[展开全文]

可变参数

可变数量的参数

1. *,将多个参数收集到一个'元组'对象中。

2. **,将多个参数收集到一个'字典'对象中。

强制命名参数

[展开全文]

参数的几种类型

位置参数

按照位置传递的参数

默认值参数

为某些参数设置默认值,这些参数传递时可选。

命名参数

按照形参的名称传递参数

 

[展开全文]

传递不可变对象是浅拷贝

[展开全文]

浅拷贝和深拷贝

浅拷贝:不拷贝子对象的内容,只拷贝引用

深拷贝:子对象的内存也全部拷贝,子对象修改不影响源对象

[展开全文]

参数的传递

从实参到形参的赋值,引用传递。

1.可变对象,直接作用于原对象本身

2.不可变对象,生出新的对象空间

可变对象有:字典、列表、集合、自定义对象等

不可变对象:数字、字符串、元组、function等

[展开全文]

函数也是对象,内存底层分析。

[展开全文]

文档字符串

help(函数名._doc_)打印函数的文档字符串

[展开全文]

O 来自 order 大写:以多项式的最大的次项的次数 大O(n) 表示 f(x) =O(g(x))  f(x)的阶与g(x)的阶相同

小写O f(x)=o(g(x))  f(x)的阶小于g(x)的阶

[展开全文]