机器学习实战---书中谬误讨论

关注公众号“码字读书会”,了解最新消息。

 

5.2.3节

首先要把5.2.2节内容做了,不然得不到回归系数weights值。
dataArr,labelMat=logRegres.loadDataSet()
logRegres.gradAscent(dataArr,labelMat)
reload(logRegres)
logRegres.plotBestFit(weights.getA())


此处画图做拟合曲线,出现一个小问题。

后来我发现作者程序清单5-2给出了答案。
def plotBestFit(wei):
    import matplotlib.pyplot as plt
    from numpy import array,shape,arange
    weights = wei.getA()
    dataMat,labelMat=loadDataSet()
    dataArr=array(dataMat)
    n=shape(dataArr)[0]
    xcord1=[]
    ycord1=[]
    xcord2=[]
    ycord2=[]
    for i in range(n):
        if int(labelMat[i])==1:
            xcord1.append(dataArr[i,1])
            ycord1.append(dataArr[i,2])
        else:
            xcord2.append(dataArr[i,1])
            ycord2.append(dataArr[i,2])
    fig=plt.figure()
    ax=fig.add_subplot(111)
    ax.scatter(xcord1,ycord1,s=30,c='red',marker='s')
    ax.scatter(xcord2,ycord2,s=30,c='green')
    x=arange(-3.0,3.0,0.1)
    y=(-weights[0]-weights[1]*x)/weights[2]
    ax.plot(x,y)
    plt.xlabel('X1')
    plt.ylabel('X2')
    plt.show()
我怀疑line 4:weights=wei.getA()做的即是logRegres.plotBestFit(weights.getA())中weight.getA()的功能。
果然删掉‘.getA()’后,成功获得曲线图。

后来发现.getA()是array的子功能,将matrix转化为array。
此处估计是作者校对时忽视掉了。
 

5.2.4节

>>> dataArr,labelMat=logRegres.loadDataSet()
>>> weights=logRegres.stocGradAscent0(array(dataArr),labelMat)
>>> logRegres.plotBestFit(weights)
对于此处的weights是由numpy.ones生成的array数组。
并不是matrix矩阵,不需要weights = wei.getA()转化。
 

机器学习实战---书中谬误讨论_第1张图片

 

你可能感兴趣的:(机器学习,机器学习,numpy)