扫二维码与项目经理沟通
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流
#!/usr/sbin/env python
创新互联建站网站建设公司一直秉承“诚信做人,踏实做事”的原则,不欺瞒客户,是我们最起码的底线! 以服务为基础,以质量求生存,以技术求发展,成交一个客户多一个朋友!专注中小微企业官网定制,成都网站制作、成都网站建设、外贸营销网站建设,塑造企业网络形象打造互联网企业效应。
# -*- coding:utf-8 -*-
import math
# ItemCF算法
def ItemSimilarity(train):
C = dict()
N = dict()
for u,items in train.items():
for i in items.keys():
N[i] += 1
for j in items.keys():
if i == j:
continue
C[i][j] += 1
W = dict()
for i,related_items in C.items():
for j,cij in related_items.items():
W[i][j] = cij / math.sqrt( N[i] * N[j])
return W
# ItemCF-IUF算法
def ItemSimilarity_v2(train):
C = dict()
N = dict()
for u,items in train.items():
for i in items.keys():
N[i] += 1
for j in items.keys():
if i == j:
continue
C[i][j] += 1 / math.log(1+len(items)*1.0)
W = dict()
for i,related_items in C.items():
for j,cij in related_items.items():
W[i][j] = cij / math.sqrt( N[i] * N[j])
return W
def Recommend(train,user_id,W,K):
rank = dict()
ru = train[user_id]
for i,pi in ru.items():
for j,wj in sorted(W[i].items,key=itemgetter(1),reverse=True)[0:K]:
if j in ru:
continue
rank[j] += pi*wj
return rank
R语言的bs()函数是用于生成B样条基函数的。Python里没有完全对应的函数,但是可以使用scipy.interpolate包中的BSpline类或splrep和splev函数来实现类似的功能。
在 数学 学科 数值分析 中, 样条 是一种特殊的 函数 ,由 多项式 分段定义。样条的 英语 单词spline来源于可变形的样条工具,那是一种在 造船 和 工程制图 时用来画出光滑形状的工具。在中国大陆,早期曾经被称做“齿函数”。后来因为工程学术语中“放样”一词而得名。
在 插值 问题中,样条插值通常比 多项式插值 好用。用低阶的样条插值能产生和高阶的多项式插值类似的效果,并且可以避免被称为 龙格现象 的数值不稳定的出现。并且低阶的样条插值还具有“保凸”的重要性质。
在 计算机科学 的 计算机辅助设计 和 计算机图形学 中,样条通常是指分段定义的多项式 参数曲线 。由于样条构造简单,使用方便,拟合准确,并能近似 曲线拟合 和交互式曲线设计中复杂的形状,样条是这些领域中曲线的常用表示方法。
scipy.interpolate.splrep(x,y,w = None,xb = None,xe = None,k = 3,task = 0,s = None,t = None,full_output = 0,per = 0,quiet = 1 )
找到一维曲线的B样条曲线表示。
给定数据点集,确定区间上度k的平滑样条近似。(x[i], y[i])xb = x = xe
x,y: array_like
定义曲线y = f(x)的数据点。
w: array_like,optional
权重的严格正秩1数组,其长度与x和y相同。权重用于计算加权最小二乘样条拟合。如果y值中的误差具有矢量d给出的标准偏差,则w应为1 / d。默认值为1(len(x))。
xb, xe:float, optional
适合的间隔。如果为None,则它们分别默认为x [0]和x [-1]。
k: int,optional
花键拟合的程度。建议使用三次样条。甚至应避免使用k值,尤其是在s值小的情况下。1 = k = 5
task:{1, 0, -1}, optional
如果task == 0,则在给定的平滑因子s下找到t和c。
如果task == 1,则找到t和c作为平滑因子s的另一个值。对于同一组数据,必须先前有一个task = 0或task = 1的调用(t将存储为内部使用)
如果task = -1,则找到给定结点t的加权最小二乘样条曲线。这些应该是内部结,因为两端的结将自动添加。
s:float, optional
平滑条件。满足以下条件来确定平滑度:sum((w (y-g)) * 2,axis = 0)= s其中g(x)是(x,y)的平滑插值。用户可以使用s来控制贴合度和贴合度之间的权衡。较大的s表示更平滑,而较小的s表示较不平滑。s的推荐值取决于权重w。如果权重代表y的标准偏差的倒数,则应在(m-sqrt(2 * m),m + sqrt(2 * m))范围内找到一个好的s值,其中m是x,y和w中的数据点。默认值:如果提供了权重,则s = m-sqrt(2 * m)。如果未提供权重,则s = 0.0(内插)。
t:array_like, optional
任务= -1所需的结。如果给出,则任务自动设置为-1。
f:full_outputbool, optional
如果非零,则返回可选输出。
per:bool, optional
如果非零,则将数据点视为周期为x [m-1]-x [0]的周期,然后返回平滑的周期样条近似。不使用y [m-1]和w [m-1]的值。
quiet:bool, optional
非零以禁止显示消息。不推荐使用此参数;请改用标准的Python警告过滤器。
Returns:
tck:tuple
元组(t,c,k),包含结向量,B样条系数和样条度。
fp:array, optional
样条近似值的平方残差的加权总和。
ier:int, optional
有关splrep成功的整数标志。如果ier = 0,则表示成功。如果[1,2,3]中的ier发生错误,但未引发。否则会引发错误。
msg:str, optional
对应于整数标志ier的消息。
下面插值一个函数
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流