HNU-数据挖掘-作业1

数据挖掘课程作业
作业1

计科210X 甘晴void 202108010XXX

第一题

假设所分析的数据包括属性 age,它在数据元组中的值（以递增序）为13 ,15 ,16 ,16 ,19 ,20 ,20 ,21 ,22 ,22 ,25 ,25 ,25 ,25 ,30 ,33 ,33 ,35 ,35 ,35 ,35 ,36 ,40 ,45 ,46 ,52,70。

a. 该数据的均值是多少？中位数是什么？
b. 该数据的众数是什么？讨论数据的模态（即二模、三模等）。
c. 该数据的中列数是多少？
d. 你能（粗略地）找出该数据的第一个四分位数（Q1）和第三个四分位数（Q3）吗？
e. 给出该数据的五数概括。
f. 绘制该数据的盒图。
g. 分位数-分位数图与分位数图有何不同？

解：

a. 该数据的均值是多少？中位数是什么？

均值：809/27=29.96
中位数：25

b. 该数据的众数是什么？讨论数据的模态（即二模、三模等）。

众数是 25 和 35，它们都出现了 4 次。
这个数据集是二模的，有两个众数，即两个峰态，因此是双峰众数。

c. 该数据的中列数是多少？

中列数：极大值与极小值的平均
极大值：70	极小值：13
中列数：（70+13）/2=41.5

d. 你能（粗略地）找出该数据的第一个四分位数（Q1）和第三个四分位数（Q3）吗？

四分位数：将数据集分成四等分的值。
Q1 表示数据的第 25% 位置处的值，而 Q3 表示数据的第 75% 位置处的值。
第一个四分位数为[27/4]=7处，Q1=20,；第三个四分位数为21处，Q3=35。

e. 给出该数据的五数概括。

五数概括包括最小值、第一四分位数（Q1）、中位数、第三四分位数（Q3）和最大值。
最小值：13
Q1（第一个四分位数）：20
中位数：25
Q3（第三个四分位数）：35
最大值：70

f. 绘制该数据的盒图。

#python代码如下
import matplotlib.pyplot as plt
data = [13, 15, 16, 16, 19, 20, 20, 21, 22, 22, 25, 25, 25, 25, 30, 33, 33, 35, 35, 35, 35, 36, 40, 45, 46, 52, 70]
plt.boxplot(data)
plt.title('Box Plot of the Data')
plt.show()

绘制图像如下：

g. 分位数-分位数图与分位数图有何不同？

简单来说，
分位数图是一种观察单变量数据分布的简单有效分发（就是上面给出的箱型图）。首先它显示给定属性的所有数据的分布情况；其次它给出了分位数信息。
分位数-分位数图则是反映了同一个属性的不同样本的数据分布情况，使得用户可以很方便地比较这两个样本之间的区别或联系。

具体地说，
分位数图是一种用来展示数据值低于或等于在一个单变量分布中独立的变量的粗略百分比。这样,他可以展示所有数的分位数信息，而为独立变量测得的值(纵轴)相对于它们的分位数(横轴)被描绘出来。
分位数-分位数图用纵轴表示一种单变量分布的分位数，用横轴表示另一单变量分布的分位数。两个坐标轴显示它们的测量值相应分布的值域，且点按照两种分布分位数值展示。
举例来说，一条线(y=x)可画到图中+以增加图像的信息。落在该线以上的点表示在y轴上显示的值的分布比x轴的相应的等同分位数对应的值的分布高。反之，对落在该线以下的点来说，则低。

以下是简单实现观测值和正态分布对比的QQ图（仅仅作为练习使用）

#python代码
import scipy.stats as stats
import matplotlib.pyplot as plt
data = [13, 15, 16, 16, 19, 20, 20, 21, 22, 22, 25, 25, 25, 25, 30, 33, 33, 35, 35, 35, 35, 36, 40, 45, 46, 52, 70]
# 计算标准正态分布的分位数
theoretical_quantiles = stats.norm.ppf([(i - 0.5) / len(data) for i in range(1, len(data) + 1)])
# 计算数据集的分位数
sample_quantiles = sorted(data)
plt.scatter(theoretical_quantiles, sample_quantiles)
plt.xlabel('Theoretical Quantiles')
plt.ylabel('Sample Quantiles')
plt.title('Q-Q Plot')
plt.show()

绘制图像如下：

第二题

在数据分析中，重要的选择相似性度量。然而，不存在广泛接受的主观相似性度量，结果可能因所用的相似性度量而异。虽然如此，在进行某种变换后，看来似乎不同的相似性度量可能等价。

假设我们有如下二维数据集：

	A1	A2
X1	1.5	1.7
X2	2	1.9
X3	1.6	1.8
X4	1.2	1.5
X5	1.5	1.0

a. 把该数据看做二维数据点。给定一个新的数据点x=(1.4,1.6) 作为查询点，使用欧几里得距离、曼哈顿距离、上确界距离和余弦相似性，基于查询点的相似性对数据库的点排位。
b. 规格化该数据集，使得每个数据点的范数等于 1。在变换后的数据上使用欧几里得距离对诸数据点排位。

解：

a.计算四种距离并给出各自排名

首先需要了解这几个距离都是怎么计算的

欧几里得距离：d=sqrt[(x1-x2)^2+(y1-y2)2]，即平面直角坐标系上两点间距离
曼哈顿距离：d=|x1-x2|+|y1-y2|
上确界距离：d=max(|x1-x2|,|y1-y2|)
余弦相似性：d=(A·B)/(||A||·||B||)，A,B分别为原点指向两个点的向量

使用以下python代码实现进行计算与排序

import numpy as np

# 数据集
data = np.array([[1.5, 1.7],
                 [2.0, 1.9],
                 [1.6, 1.8],
                 [1.2, 1.5],
                 [1.5, 1.0]])

# 查询点
query_point = np.array([1.4, 1.6])

# a. 使用不同相似性度量对数据点进行排名

# 欧几里得距离
euclidean_distances = np.sqrt(np.sum((data - query_point) ** 2, axis=1))
euclidean_ranking = np.argsort(euclidean_distances)

# 曼哈顿距离
manhattan_distances = np.sum(np.abs(data - query_point), axis=1)
manhattan_ranking = np.argsort(manhattan_distances)

# 上确界距离
supremum_distances = np.max(np.abs(data - query_point), axis=1)
supremum_ranking = np.argsort(supremum_distances)

# 余弦相似性
cosine_similarities = np.dot(data, query_point) / (np.linalg.norm(data, axis=1) * np.linalg.norm(query_point))
cosine_ranking = np.argsort(cosine_similarities)[::-1]  # 使用负值排名，因为余弦相似性越大越相似

# 计算值
print("欧几里得距离计算值:", euclidean_distances)
print("曼哈顿距离计算值:", manhattan_distances)
print("上确界距离计算值:", supremum_distances)
print("余弦相似性计算值:", cosine_similarities)

# 打印排名结果
print("欧几里得距离排名:", euclidean_ranking + 1)  # 加1以匹配数据点的索引
print("曼哈顿距离排名:", manhattan_ranking + 1)
print("上确界距离排名:", supremum_ranking + 1)
print("余弦相似性排名:", cosine_ranking + 1)

结果如下：

E:\anaconda\envs\python3-11\python.exe E:\python_files\数据挖掘\homework1\homework1-2.py 
欧几里得距离计算值: [0.14142136 0.67082039 0.28284271 0.2236068  0.60827625]
曼哈顿距离计算值: [0.2 0.9 0.4 0.3 0.7]
上确界距离计算值: [0.1 0.6 0.2 0.2 0.6]
余弦相似性计算值: [0.99999139 0.99575226 0.99996948 0.99902823 0.96536339]
欧几里得距离排名: [1 4 3 5 2]
曼哈顿距离排名: [1 4 3 5 2]
上确界距离排名: [1 4 3 2 5]
余弦相似性排名: [1 3 4 2 5]

整理与绘制表格

表一：相似性计算结果

	X1	X2	X3	X4	X5
欧几里得距离	0.14	0.67	0.28	0.22	0.61
曼哈顿距离	0.2	0.9	0.4	0.3	0.7
上确界距离	0.1	0.6	0.2	0.2	0.6
余弦相似性	0.99999139	0.99575226	0.99996948	0.99902823	0.99902823

表二：相似性排序结果

	排序结果
欧几里得距离	X1 < X4 < X3 < X5 < X2
曼哈顿距离	X1 < X4 < X3 < X5 < X2
上确界距离	X1 < X4 < X3 < X2 < X5
余弦相似性	X1 > X3 > X4 > X2 > X5

注意余弦相似性计算结果越大表示越相似。

b.规格化数据集并在变换后重新用欧几里得距离排序

操作如下：

计算每个数据点的范数（欧几里得距离）
将每个数据点除以其范数，以规格化数据点
使用规格化后的数据集计算欧几里得距离并对数据点进行排名

可以使用python实现如上过程

import numpy as np

# 数据集
data = np.array([[1.5, 1.7],
                 [2.0, 1.9],
                 [1.6, 1.8],
                 [1.2, 1.5],
                 [1.5, 1.0]])

# 计算每个数据点的范数
norms = np.linalg.norm(data, axis=1)

# 规格化数据集
normalized_data = data / norms[:, np.newaxis]

# 查询点，需要进行规格化
query_point = np.array([1.4, 1.6])

# 规格化查询点
query_point_norm = np.linalg.norm(query_point)
normalized_query_point = query_point / query_point_norm

# 使用欧几里得距离对规格化后的数据点进行排名
euclidean_distances = np.linalg.norm(normalized_data - normalized_query_point, axis=1)
euclidean_ranking = np.argsort(euclidean_distances)

# 打印欧几里得距离计算值和排名
print("欧几里得距离计算值:", euclidean_distances)
print("欧几里得距离排名:", euclidean_ranking + 1)  # 加1以匹配数据点的索引

运行结果如下：

E:\anaconda\envs\python3-11\python.exe E:\python_files\数据挖掘\homework1\homework1-2b.py 
欧几里得距离计算值: [0.00414935 0.09217091 0.00781232 0.04408549 0.26319805]
欧几里得距离排名: [1 3 4 2 5]

表三：规格化后的欧几里得距离排序

	X1	X2	X3	X4	X5
规格化后的欧几里得距离	0.0041	0.0922	0.0078	0.0441	0.2632

排序结果：X1 < X3 < X4 < X2 < X5

第三题

使用如下方法规范化如下数组：

200，300，400，600，1000

a. 令 min=0，max=1，最小—最大规范化。
b. z 分数规范化。
c. z 分数规范化，使用均值绝对偏差而不是标准差。
d. 小数定标规范化。

解：

首先了解这四种数据规范化的方法的操作步骤

最小-最大规范化：
- 解释：将数据缩放到一个指定的范围，通常是[0, 1]。
- 计算方法：对于每个数据点X，使用以下公式进行规范化： X=[X-min(X)]/[max(X)-min(X)]
- 意义：这种方法确保了所有数据都位于指定的范围内，其中最小值映射为0，最大值映射为1。
z 分数规范化：
- 解释：将数据映射为均值为0，标准差为1的正态分布（z 分数分布）。
- 计算方法：对于每个数据点X，使用以下公式进行规范化： X=(X-μ)/σ，其中μ为均值，σ为标准差
- 意义：这种方法适用于数据分布近似正态分布的情况，可以使数据更容易进行比较和分析。
z 分数规范化（使用均值绝对偏差而不是标准差）：
- 解释：将数据映射为均值为0，均值绝对偏差为1的分布。
- 计算方法：： X=(X-μ)/MAD，其中μ为均值，MAD为均值绝对偏差，MAD=(1/n)[Σ|xi-μ|]
- 意义：均值绝对偏差是数据点到均值的绝对距离的均值，与标准差不同。这种方法在数据中存在离群值（异常值）的情况下更稳健。
小数定标规范化：
- 解释：通过移动小数点，将数据映射到[-1, 1]或其他合适的范围。
- 计算方法：找到数据中的最大绝对值，然后计算一个缩放因子，通常是10的幂，以便将最大绝对值缩放到1之下。然后，将所有数据点除以这个缩放因子。
- 意义：这种方法将数据点缩放到[-1, 1]或[-0.1, 0.1]等范围内，使数据易于理解和比较。这里我选取的是[-1,1]

不同的规范化方法适用于不同的数据和分析场景。您可以根据数据的性质和分析要求选择适当的规范化方法。

使用python代码实现

#给定数据
data = [200, 300, 400, 600, 1000]

# 最小-最大规范化
min_val = min(data)
max_val = max(data)
normalized_data = [(x - min_val) / (max_val - min_val) for x in data]
#print(normalized_data)
print([round(val, 2) for val in normalized_data])  # 保留两位小数

#  z 分数规范化，使用标准差
import statistics
mean = statistics.mean(data)
std_dev = statistics.stdev(data)
z_scores = [(x - mean) / std_dev for x in data]
#print(z_scores)
print([round(val, 2) for val in z_scores])  # 保留两位小数


# z 分数规范化，使用均值绝对偏差
def mean_absolute_deviation(data):
    mean = sum(data) / len(data)
    deviation = [abs(x - mean) for x in data]
    return sum(deviation) / len(deviation)

mad = mean_absolute_deviation(data)
normalized_data = [(x - statistics.mean(data)) / mad for x in data]
#print(normalized_data)
print([round(val, 2) for val in normalized_data])

# 小数定标规范化
max_val = max(data)
num_digits = len(str(max_val))
scaled_data = [x / (max_val) for x in data]
#print(scaled_data)
print([round(val, 2) for val in scaled_data]) # 保留两位小数

结果如下：

E:\anaconda\envs\python3-11\python.exe E:\python_files\数据挖掘\homework1\homework1-3.py 
[0.0, 0.12, 0.25, 0.5, 1.0]
[-0.95, -0.63, -0.32, 0.32, 1.58]
[-1.25, -0.83, -0.42, 0.42, 2.08]
[0.2, 0.3, 0.4, 0.6, 1.0]

绘制表格如下

	X1	X2	X3	X4	X5
最小-最大规范化	0.0	0.12	0.25	0.5	1.0
z 分数规范化（标准差）	-0.95	-0.63	-0.32	-0.32	1.58
z 分数规范化（均值绝对偏差）	-1.25	-0.83	-0.42	0.42	2.08
小数定标规范化	0.2	0.3	0.4	0.6	1.0

第四题

假设 12 个销售价格记录已经排序，如下所示：

5，10，11，13，15，35，50，55，72，92，204，215

使用如下各方法将它们划分成三个箱。

a. 等频（等深）划分。
b. 等宽划分。
c. 聚类。

解：

a. 等频（等深）划分：

等频划分将数据集分成相等数量的箱，每个箱中包含近似相等数量的数据点。

首先，计算数据集的总数，即 12。
然后，计算每个箱的大小，即 12 / 3 = 4。
从最小值5开始，将数据点按顺序放入箱中，直到每个箱包含4个数据点为止。

划分后的三个箱分别是：

箱1: [5, 10, 11, 13]
箱2: [15, 35, 50, 55]
箱3: [72, 92, 204, 215]

b. 等宽划分：

等宽划分将数据集分成包含相等数值范围的箱。

首先，找到数据集的最小值（5）和最大值（215）。
计算数值范围，即 215 - 5 = 210。
将数值范围除以3，以确定每个箱的宽度，即 210 / 3 = 70。
从最小值开始，创建三个箱，每个箱的宽度为70。
第一个箱，5-75；第二个箱，75-145；第三个箱，145-215

划分后的三个箱分别是：

箱1: [5, 10, 11, 13, 15, 35, 50, 55, 72]
箱2: [92]
箱3: [204, 215]

c. 聚类：

聚类方法：使用聚类算法来将数据点分成组。使用 k-means 聚类方法，将数据点划分成三个簇。这个过程需要计算簇的中心点，然后将每个数据点分配到离它最近的中心点所属的簇。

本题由于数据只有一个维度，故没有必要进行标准化，也可以进行标准化，但是实际测试没有改变结果（符合预期）。

在Python中，可以使用sklearn库来执行 k-means 聚类。使用以下代码实现。

from sklearn.cluster import KMeans
import numpy as np
from sklearn.preprocessing import StandardScaler

data = np.array([5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204, 215])
data = data.reshape(-1, 1)  # 将数据转换为一列

# 标准化数据
# scaler = StandardScaler()
# data = scaler.fit_transform(data)

kmeans = KMeans(n_clusters=3, algorithm='lloyd').fit(data)
print(kmeans)
labels = kmeans.labels_

# 根据标签将数据点分为三个簇
cluster1 = data[labels == 0]
cluster2 = data[labels == 1]
cluster3 = data[labels == 2]

print("簇1:", cluster1)
print("簇2:", cluster2)
print("簇3:", cluster3)

# 打印每个簇的中心点位置
centers = kmeans.cluster_centers_
print("簇1 中心点:", centers[0])
print("簇2 中心点:", centers[1])
print("簇3 中心点:", centers[2])

这将使用 k-means 聚类将数据点划分成三个簇。在示例代码中，cluster1、cluster2 和 cluster3 包含了每个簇的数据点。

划分后的三个箱分别是：

箱1: [5, 10, 11, 13, 15, 35]
箱2: [50, 55, 72, 92]
箱3: [204, 215]

这三个簇的中心点分别为

14.833
67.25
209.5

数据挖掘|数据预处理|基于Python的数据标准化方法皖山文武数据挖掘数据建模与分析 python 数据挖掘开发语言
基于Python的数据标准化方法1.z-score方法2.极差标准化方法3.最大绝对值标准化方法在数据分析之前，通常需要先将数据标准化（Standardization），利用标准化后的数据进行数据分析，以避免属性之间不同度量和取值范围差异造成数据对分析结果的影响。1.z-score方法Z-score方法是基于原始数据的均值和标准差来进行数据标准化的，处理后的数据均值为0，方差为1，符合标准正态分布
夫子庙前的金子招牌光中的cici
古城都不乏老招牌，比如苏杭，比如南京。随便一个都有久远的年代。夫子庙前，乌衣巷口，店肆成市招牌林立繁华重归来。难为我一个外地人，究竟该喝谁家的那碗鸭血粉丝汤呢？在网上研究了半天，选了秦淮人家。只因为三点：一，临河就着秦淮河喝鸭血汤就着秦淮河喝鸭血汤二，装修较其他一溜大白墙的店算讲究的了，我特别吃环境，没办法～三，有鸭血汤鸭血汤倒是有，夹杂在一套所谓的套餐里，不允许单独点菜。我是为了这秦淮河买的单，
Ai插件脚本合集安装包，免费教程视频网盘分享全网优惠分享君
随着人工智能技术的不断发展，越来越多的插件脚本涌现出来，为我们的生活和工作带来了便利。然而，如何快速、方便地获取和使用这些插件脚本呢？今天，我将为大家分享一个非常实用的资源——AI插件脚本合集安装包，以及免费教程视频网盘分享。首先，让我们来了解一下这个AI插件脚本合集安装包。它是一个集合了众多AI插件脚本的资源包，涵盖了各种领域，如数据分析、自动化办公、智能客服等等。通过这个安装包，用户可以轻松地
自己选择的路，爬也要爬完一只疯狂的没有目标的青豆子
你有没有怀疑过人生？有没有怀疑过自己的选择？有没有在一开始很坚定，然后走着走着就开始怀疑自己为什么要走这么苦逼的路，也开始后悔自己当初的选择？相信谁都有过这样的经历，但是最终的结果呢？是依旧坚持走到了最后，还是说你真的放弃了？朋友狠狠的告诉我：“我自己选的路，爬也要爬完，我就是要对自己狠”。我说：“为什么？为什么非要坚持下去？”他说：“我知道选择的对与错，既然已经开始了，我就选择风雨兼程、坚持到底
过去一年，这16本好书不容错过 m0_54050778 perl
编者按：2023年在动荡与希望中收尾，2023年注定会被载入史册。疫情寒冬结束，ChatGPT横空出世，带动了人工智能技术的飞速发展；淄博烧烤、天津大爷、尔滨之旅等充满感动与幸福。但与此同时，2023年又是动荡与不安的一年，俄乌冲突的延宕，新一轮的巴以冲突，极端天气频发。在这个大环境下，有一些经典的书籍著作诞生。本文将分享2023年最值得一读的16本书籍，文章来自翻译，希望对你有所启示。关于202
如果你也中午睡不着心理小松
不知从何时开始，我中午就很难入睡了。尤其是这个冬天，尤其是这个疫情期。可能是脚冷？躺在床上，脚冰冷的感觉很是难以忽略。躺在床上就像是一脚踩进了冰湖。后来我想了很多办法，我有两个暖手宝。嗯，前女友寄回给我的。中午放在脚下，那天中午果然睡得舒服。然而，第二天这就不行了。还是睡不着。可能是覆盖不到脚。毕竟是暖手的。幸好还有十几个暖宝宝。中午睡前贴在脚上。关上窗户，拉好窗帘，本来通风的，虽然疫情，我还是选
爱心账户之存钱日记11.20 静_d595
新沙发终于到了，满心欢喜，可旧沙发的处理又是个头疼的问题，免费送都没有人要。临时想起来公司那个收垃圾的，看看付费能不能拉走。对方说随便给点都行，我又拿不准，于是就想说88把。对方说给两包烟就行了，我说还是给钱吧，也不想欠人情。如果请专门搬东西的估计得200加了，还算是比较顺利，刚好想到他。选了12元存进我的爱心账户！
2024中国消费者健康数字创新峰会上海希为健康医疗
2024中国消费者健康数字创新峰会会议时间：2024年5月21-22日会议地点：中国·上海主办方：ECVInternational（本次会议线上线下同步举行）一、会议背景随着健康中国2030战略规划不断推进，消费者健康市场发展也日趋强劲，体现出健康消费意识提前，自我健康管理意识增强的局面。后疫情时代下，消费者健康市场呈现出卓越的韧性与活力。本次峰会将汇集医疗大健康领域专家、企业领袖、零售连锁药店专
ChatGPT技巧大揭秘：AI写代码新境界 2401_83550420 chatgpt4.0 chatgpt chatgpt 人工智能 AI写作
ChatGPT无限次数:点击直达ChatGPT技巧大揭秘：AI写代码新境界随着人工智能技术的不断进步，开发人员现在有了更多有趣的工具来提高他们的工作效率。其中，ChatGPT作为一种基于深度学习的自然语言处理模型，已经成为许多开发者的新宠。在本文中，我们将揭秘使用ChatGPT来帮助编写代码的技巧，探索AI在编程领域的新境界。ChatGPT简介ChatGPT是一种基于大型神经网络的对话生成模型，它
ChatGPT：AI合作伙伴助你成为论文写作高手 2401_83550420 chatgpt chatgpt 人工智能 AI写作
ChatGPT无限次数:点击直达摘要：本文将介绍ChatGPT3.5Turbo（以下简称ChatGPT），一款强大的AI合作伙伴，能够助你成为一名论文写作高手。我们将深入探讨ChatGPT的特点、优势，并提供多个示例，展示ChatGPT在论文写作中的应用。无论是开展研究、撰写论文、还是与ChatGPT进行互动交流，都能够帮助你提升写作效率和质量。引言：随着人工智能的发展，聊天型语言模型在各个领域都
AI大模型学习：开启智能时代的新篇章游向大厂的咸鱼人工智能学习
随着人工智能技术的不断发展，AI大模型已经成为当今领先的技术之一，引领着智能时代的发展。这些大型神经网络模型，如OpenAI的GPT系列、Google的BERT等，在自然语言处理、图像识别、智能推荐等领域展现出了令人瞩目的能力。然而，这些模型的背后是一系列复杂的学习过程，深度学习技术的不断演进推动了AI大模型学习的发展。首先，AI大模型学习的基础是深度学习技术。深度学习是一种模仿人类大脑结构的机器
大模型的学习 LLaMa和ChatGLM，minichatgpt4 贝猫说python 学习 llama 人工智能
LLaMa和ChatGLM，minichatgpt4什么情况用Bert模型，什么情况用LLaMA、ChatGLM类大模型，咋选？答：Bert的模型由多层双向的Transformer编码器组成，由12层组成，768隐藏单元，12个head，总参数量110M，约1.15亿参数量。NLU（自然语言理解）任务效果很好，单卡GPU可以部署，速度快，V100GPU下1秒能处理2千条以上。ChatGLM-6B,
育儿小课堂：如何尽早培养孩子良好的阅读习惯？嘉宁麻麻
对于培养阅读习惯有多种建议，下面介绍几种轻松实用的建议。阅读部分一，创建阅读仪式：留出一段特别的时间作为每日读书时间，把和孩子一起选“每日一书”变成惯例，然后坐在一个专门的位置读书。二，依偎：找一个安静、舒适的地方读书，让孩子紧紧依偎着你，也可以让孩子拿着一个喜爱的玩具，或者是揽着他喜爱的被子。三，富有表情地读：注意韵律和节奏，每个角色用不同声音，不要用“娃娃腔”。家庭环境部分：四，眼里有书：家里
OpenCV（一个C++人工智能领域重要开源基础库）简介愚梦者 OpenCV 人工智能人工智能 opencv c++图像处理计算机视觉开源
返回：OpenCV系列文章目录（持续更新中......）上一篇：OpenCV4.9.0配置选项参考下一篇：OpenCV4.9.0开源计算机视觉库安装概述引言：OpenCV（全称OpenSourceComputerVisionLibrary）是一个基于开放源代码发行的跨平台计算机视觉库，可以用来进行图像处理、计算机视觉和机器学习等领域的开发。该库由英特尔公司于1999年开始开发，最初是为了加速处理器
ChatGPT：智能论文写作指南，让您成为写作高手 AI臻蚌 chatgpt4.0 chatgpt chatgpt 人工智能 AI写作
ChatGPT无限次数:点击直达写作是学术研究中不可或缺的一环，然而，对于许多人来说，写作往往是一项艰巨而费时的任务。但是，现在有了ChatGPT，您将能够以前所未有的速度和准确性编写高质量的论文。本文将向您介绍如何利用ChatGPT的强大功能成为写作高手，并为您提供一些示例，展示其在不同领域的应用。1.简介ChatGPT是一种基于人工智能的语言模型，它可以理解并生成人类语言。通过训练大量的语料库
ChatGPT神技：AI成为你的编程良友 2401_83481083 chatgpt4.0 chatgpt chatgpt 人工智能 AI写作
ChatGPT无限次数:点击直达ChatGPT神技：AI成为你的编程良友近年来，人工智能技术的发展迅猛，ChatGPT作为其中一项创新技术，正逐渐走进我们的生活。在编程领域，AI不仅可以助力我们提高效率，还能成为我们的良友，帮助解决各种编程难题。一、ChatGPT简介ChatGPT是一种基于自然语言处理技术的人工智能模型，它能够生成类人对话。ChatGPT通过深度学习模型，能够理解输入的文本并生成
数字逻辑不可能涌现出智能 dog250 人工智能
先看一系列竖式乘法的步骤：相乘的两个数数位越大，步骤越多。如果不纠结数制，二进制运算也是这回事，把单个步骤用一个晶体管表达(其实一个步骤不止一个晶体管)，数位越大，所需的晶体管越多。先说结论，所有基于n进制的逻辑运算都不可扩展。硅基时序电路可如此巧妙完成精确计算，开启了数字化时代，人们试图将AI构建在这二进制世界。但若二进制运算不可扩展，基于数字逻辑的人工智能就不可能。前面提到过，二进制运算本质上
2022-07-16 一周记录小铭的学习周记
本周一点评了下索菲亚双休日的公告，没想到领导的反馈还不错；周中听了路演报告，问了些问题&成功勾搭上一位卖方大佬。我看的行业偶有业绩预告，在周五早上大致说了下造纸板块的情况，下午的分享汇报的反馈结果偏负面（唉）（部分原因是我选的公司没选好，哭）。本周又有新领导加入，似乎要对部门进行一系列改革，和每个人都有谈话，也了解了下我的大致情况，鼓励我们新人多出去调研，然而我的白名单都还没开全。。。。本周反省：
让数据说话：人工智能与六西格玛的完美结合张驰课堂人工智能六西格玛
当人工智能与六西格玛结合，企业可以充分利用人工智能技术的数据处理、预测分析和智能决策支持能力，实现数据驱动的决策、质量控制和流程优化，从而提高企业的效率和竞争力。下面张驰咨询给大家具体的介绍：1、数据驱动决策六西格玛侧重于数据分析和决策制定，而人工智能可以提供更强大的数据处理和分析能力。通过人工智能技术，可以自动收集和整理大量的数据，并进行有效的数据挖掘和模式识别。这些数据分析结果可以为六西格玛项
路阳妈妈日本打工记(205) 359一牡丹江一杨金芝一路老师
已经6点多了，厨房里静悄悄的。今天去总公司给老生开欢送会，十点才出发。前天我们还参观了陶瓷展览，展示柜里的陶瓷无一是完整的，姐妹们议论说是从中国运来时，不小心摔坏的，哈哈。中午大科长请我们吃饭，还是在这个展览厅内，不在一个楼层，是在顶楼，五楼。是我来日本看到的最高的楼。日本是个多地震的国家，楼层没有太高的。中午吃的面条，我们自己选的。没想到端上来满满一大碗，吓我们一跳。这能吃了吗？最后的结果是两位
智合同如何助力建筑行业合同智能化管理智合同（小智）合同智能应用 AI技术降本增效提质人工智能自然语言处理知识图谱深度学习大数据
#建筑行业#人工智能#AI#合同智能应用#深度学习#自然语言处理技术#知识图谱智合同-采用深度学习、自然语言处理技术、知识图谱等人工智能技术，为企业提供专业的合同相关的智能服务。其主要服务包含：合同智能审查、合同要素智能提取、合同版本对比、合同智能起草、ICR智能识别、合同履约追踪、文本一致性对比、广告审查、合同范本库等服务。智合同在助力建筑行业合同智能化管理方面具有显著的优势。首先，智合同利用A
AI原生安全亚信安全首个“人工智能安全实用手册”开放阅览亚信安全官方账号安全网络 web安全人工智能大数据
不断涌现的AI技术新应用和大模型技术革新，让我们感叹从没有像今天这样，离人工智能的未来如此之近。追逐AI原生？企业组织基于并利用大模型技术探索和开发AI应用的无限可能，迎接生产与业务模式的全面的革新。我们更应关心AI安全原生。实施人工智能是一项复杂又长远的任务，任何希望利用大模型的组织在设计之初，都必须将安全打入地基，安全一定是AI技术发展的核心要素。针对人工智能和大模型面临的威胁与攻击模式，亚信
开发chrome扩展（禁止指定域名使用插件）徐同保 chrome 前端
mainfest.json:{"manifest_version":3,"name":"ChatGPT学习","version":"0.0.2","description":"ChatGPT,GPT-4,Claude3,Midjourney,StableDiffusion,AI,人工智能,AI","icons":{"16":"./images/logo.png","48":"./images/lo
小程序VS App，选哪个更划算？真仲为工作室小程序开发小程序
在移动应用开发的世界中，小程序和APP是两种主要的应用形式，它们各有特点，适应不同的业务需求和开发场景。对于许多企业和个人开发者而言，选择开发小程序还是APP是一个需要仔细考虑的决策。本文将对两者进行比较，帮助读者更好地理解它们的优劣和适用情况。小程序是一种无需下载安装即可使用的应用，它运行在微信、支付宝等大型社交平台内，用户通过扫码或搜索就能快速进入。小程序的开发门槛相对较低，更新迭代速度快，适
我的理财成果——熊市下的投资收益率（二）唐麦吉
接上一篇：我的理财成果——熊市下的投资收益率（一）https://www.jianshu.com/p/30266a2d615f01我选的第一只股票是长安汽车，买的时候价格是10.35，5月15号。当时的大盘已经跌了一波了，从年初的3500点跌到了3100左右，而这只股票也从十二三块的价格跌到了10.35元。买了以后心里还是很没有底的，看资料是看资料，实践是实践，而且这毕竟是真金白银的资金。心里多多
洛谷 1853.投资的最大效益是小Y啦算法 c++动态规划
思路：完全背包。首先从题目的分析中我们可以知道，这里的债卷是可以无限次购买的，所以我们可以认定，这是个在选与不选的问题中，而且各个选项都是可以无限次选择的。确定了做法之后，我们需要看到这道题和普通的背包问题不同的地方，那就是我们如果只是写出模板的话，只能得到第一年的最大利润加资产。但是这里有要求说是多少年的。所以我们需要把第一次的数据存储到另一个数组当中，然后再还给他进行更新操作，这样才能在保证第
阿里云新用户专享优惠券在哪领取？阿里云新用户优惠券怎么使用？阿里云最新优惠和活动汇总
阿里云新用户专享优惠券在哪领取？阿里云新用户优惠券怎么使用？阿里云优惠券是阿里云的一种优惠活动，也称为阿里云限量红包，阿里云优惠券可以在购物中抵扣同样等值的现金使用。合理使用优惠券，当购物者购买云产品达到满减条件时,凭阿里云优惠券可享有一定的总额减免。阿里云无门槛优惠券在哪里领取？目前阿里云的新客专属福利如下，阿里云新用户可以无门槛领取优惠券，最高888元：5元无门槛优惠券，满50减5优惠券，满1
有声绘本有必要买吗？听绘本和读绘本的区别，哪个更好绘多多
亲爱的家长朋友们，您是否曾为如何更好地激发孩子阅读兴趣、提升他们的语言能力而思索？在儿童教育领域中，有声绘本以其独特的魅力和功能成为许多家庭的必备之选。那么，有声绘本是否有必要购买？听绘本与读绘本又各自具有怎样的优势呢？让我们一起来探讨。淘宝/京东/拼多多/唯品会/外卖等平台超级红包|活动无门槛红包https://www.chaojiyouhui有声绘本的必要性多元感官刺激：有声绘本将视觉与听觉完
ai智能语音机器人的出现未来电销行业会如何发展？ VO_794632978 WX-794632978 语音机器人人工智能机器人交互语音识别大数据
人工智能和移动互联网技术的发展，对于很多行业都产生了颠覆性的影响。而对于电销这一重复度较高的行业来说，也是产生了巨大的推动作用。对于传统电销人来说，电销机器人可以帮助你提高销售效率，提高影响客户的能力和转化率，将你过去繁琐简单无效的需要个人做的工作，都交给机器，让你的时间和精力，放在重要的客户和有创造性的事情上。我们一起来看看都有哪些发展。自动化程度提高：AI机器人能够不间断地工作，自动拨打电话、
【生活日记】王雅婕《拍照1》王雅婕
2020年5月17日星期日拍照祁门县实验学校402班王雅婕今天下午妈妈把我送到了萌娃当家，我穿上了鞋就去选衣服了，我看见了一个很好看的衣服，我看现在有很多人都穿这种衣服，我也就选了这样的衣服。后来，我穿好了衣服，就下楼了，阿姨对我说：“坐在这里，我帮你化妆。”我点了点头。阿姨就给我化了妆，我照着镜子看了看，心想：这也太好看了吧！阿姨把我的头发梳理了一下，戴上了一顶小帽子，我想淑女一样走上了楼，我对
二分查找排序算法周凡杨 java 二分查找排序算法折半
一：概念二分查找又称折半查找（折半搜索/ 二分搜索），优点是比较次数少，查找速度快，平均性能好；其缺点是要求待查表为有序表，且插入删除困难。因此，折半查找方法适用于不经常变动而查找频繁的有序列表。首先，假设表中元素是按升序排列，将表中间位置记录的关键字与查找关键字比较，如果两者相等，则查找成功；否则利用中间位置记录将表分成前、后两个子表，如果中间位置记录的关键字大于查找关键字，则进一步
java中的BigDecimal bijian1013 java BigDecimal
在项目开发过程中出现精度丢失问题，查资料用BigDecimal解决，并发现如下这篇BigDecimal的解决问题的思路和方法很值得学习，特转载。原文地址：http://blog.csdn.net/ugg/article/de
Shell echo命令详解 daizj echo shell
Shell echo命令 Shell 的 echo 指令与 PHP 的 echo 指令类似，都是用于字符串的输出。命令格式： echo string 您可以使用echo实现更复杂的输出格式控制。 1.显示普通字符串: echo "It is a test" 这里的双引号完全可以省略，以下命令与上面实例效果一致： echo Itis a test 2.显示转义
Oracle DBA 简单操作周凡杨 oracle dba sql
--执行次数多的SQL select sql_text,executions from ( select sql_text,executions from v$sqlarea order by executions desc ) where rownum<81; &nb
画图重绘朱辉辉33 游戏
我第一次接触重绘是编写五子棋小游戏的时候，因为游戏里的棋盘是用线绘制的，而这些东西并不在系统自带的重绘里，所以在移动窗体时，棋盘并不会重绘出来。所以我们要重写系统的重绘方法。在重写系统重绘方法时，我们要注意一定要调用父类的重绘方法，即加上super.paint(g)，因为如果不调用父类的重绘方式，重写后会把父类的重绘覆盖掉，而父类的重绘方法是绘制画布，这样就导致我们
线程之初体验西蜀石兰线程
一直觉得多线程是学Java的一个分水岭，懂多线程才算入门。之前看《编程思想》的多线程章节，看的云里雾里，知道线程类有哪几个方法，却依旧不知道线程到底是什么？书上都写线程是进程的模块，共享线程的资源，可是这跟多线程编程有毛线的关系，呜呜。。。线程其实也是用户自定义的任务，不要过多的强调线程的属性，而忽略了线程最基本的属性。你可以在线程类的run()方法中定义自己的任务，就跟正常的Ja
linux集群互相免登陆配置林鹤霄 linux
配置ssh免登陆 1、生成秘钥和公钥 ssh-keygen -t rsa 2、提示让你输入，什么都不输，三次回车之后会在~下面的.ssh文件夹中多出两个文件id_rsa 和 id_rsa.pub 其中id_rsa为秘钥，id_rsa.pub为公钥，使用公钥加密的数据只有私钥才能对这些数据解密 c
mysql : Lock wait timeout exceeded; try restarting transaction aigo mysql
原文：http://www.cnblogs.com/freeliver54/archive/2010/09/30/1839042.html 原因是你使用的InnoDB 表类型的时候, 默认参数:innodb_lock_wait_timeout设置锁等待的时间是50s, 因为有的锁等待超过了这个时间,所以抱错. 你可以把这个时间加长,或者优化存储
Socket编程基本的聊天实现。 alleni123 socket
public class Server { //用来存储所有连接上来的客户 private List<ServerThread> clients; public static void main(String[] args) { Server s = new Server(); s.startServer(9988); } publi
多线程监听器事件模式(一个简单的例子) 百合不是茶线程监听模式
多线程的事件监听器模式监听器时间模式经常与多线程使用,在多线程中如何知道我的线程正在执行那什么内容,可以通过时间监听器模式得到创建多线程的事件监听器模式思路: 1, 创建线程并启动,在创建线程的位置设置一个标记 2,创建队
spring InitializingBean接口 bijian1013 java spring
spring的事务的TransactionTemplate，其源码如下： public class TransactionTemplate extends DefaultTransactionDefinition implements TransactionOperations, InitializingBean{ ... } TransactionTemplate继承了DefaultT
Oracle中询表的权限被授予给了哪些用户 bijian1013 oracle 数据库权限
Oracle查询表将权限赋给了哪些用户的SQL，以备查用。 select t.table_name as "表名", t.grantee as "被授权的属组", t.owner as "对象所在的属组"
【Struts2五】Struts2 参数传值 bit1129 struts2
Struts2中参数传值的3种情况 1.请求参数绑定到Action的实例字段上 2.Action将值传递到转发的视图上 3.Action将值传递到重定向的视图上一、请求参数绑定到Action的实例字段上以及Action将值传递到转发的视图上 Struts可以自动将请求URL中的请求参数或者表单提交的参数绑定到Action定义的实例字段上，绑定的规则使用ognl表达式语言
【Kafka十四】关于auto.offset.reset[Q/A] bit1129 kafka
I got serveral questions about auto.offset.reset. This configuration parameter governs how consumer read the message from Kafka when there is no initial offset in ZooKeeper or
nginx gzip压缩配置 ronin47 nginx gzip 压缩范例
nginx gzip压缩配置更多 0 nginx gzip 配置随着nginx的发展，越来越多的网站使用nginx，因此nginx的优化变得越来越重要，今天我们来看看nginx的gzip压缩到底是怎么压缩的呢？ gzip(GNU-ZIP)是一种压缩技术。经过gzip压缩后页面大小可以变为原来的30%甚至更小，这样，用
java-13.输入一个单向链表，输出该链表中倒数第 k 个节点 bylijinnan java
two cursors. Make the first cursor go K steps first. /* * 第 13 题：题目：输入一个单向链表，输出该链表中倒数第 k 个节点 */ public void displayKthItemsBackWard(ListNode head,int k){ ListNode p1=head,p2=head;
Spring源码学习-JdbcTemplate queryForObject bylijinnan java spring
JdbcTemplate中有两个可能会混淆的queryForObject方法： 1. Object queryForObject(String sql, Object[] args, Class requiredType) 2. Object queryForObject(String sql, Object[] args, RowMapper rowMapper) 第1个方法是只查
[冰川时代]在冰川时代,我们需要什么样的技术? comsci 技术
看美国那边的气候情况....我有个感觉...是不是要进入小冰期了? 那么在小冰期里面...我们的户外活动肯定会出现很多问题...在室内呆着的情况会非常多...怎么在室内呆着而不发闷...怎么用最低的电力保证室内的温度.....这都需要技术手段... &nb
js 获取浏览器型号 cuityang js 浏览器
根据浏览器获取iphone和apk的下载地址 <!DOCTYPE html> <html> <head> <meta charset="utf-8" content="text/html"/> <meta name=
C# socks5详解转 dalan_123 socket C#
http://www.cnblogs.com/zhujiechang/archive/2008/10/21/1316308.html 这里主要讲的是用.NET实现基于Socket5下面的代理协议进行客户端的通讯，Socket4的实现是类似的，注意的事，这里不是讲用C#实现一个代理服务器，因为实现一个代理服务器需要实现很多协议，头大，而且现在市面上有很多现成的代理服务器用，性能又好，
运维 Centos问题汇总 dcj3sjt126com 云主机
一、sh 脚本不执行的原因 sh脚本不执行的原因只有2个 1.权限不够 2.sh脚本里路径没写完整。二、解决You have new mail in /var/spool/mail/root 修改/usr/share/logwatch/default.conf/logwatch.conf配置文件 MailTo = MailFrom 三、查询连接数
Yii防注入攻击笔记 dcj3sjt126com sql WEB安全 yii
网站表单有注入漏洞须对所有用户输入的内容进行个过滤和检查，可以使用正则表达式或者直接输入字符判断，大部分是只允许输入字母和数字的，其它字符度不允许；对于内容复杂表单的内容，应该对html和script的符号进行转义替换：尤其是<,>,',"",&这几个符号这里有个转义对照表： http://blog.csdn.net/xinzhu1990/articl
MongoDB简介[一] eksliang mongodb MongoDB简介
MongoDB简介转载请出自出处：http://eksliang.iteye.com/blog/2173288 1.1易于使用 MongoDB是一个面向文档的数据库，而不是关系型数据库。与关系型数据库相比，面向文档的数据库不再有行的概念，取而代之的是更为灵活的“文档”模型。另外，不
zookeeper windows 入门安装和测试 greemranqq zookeeper 安装分布式
一、序言以下是我对zookeeper 的一些理解： zookeeper 作为一个服务注册信息存储的管理工具，好吧，这样说得很抽象，我们举个“栗子”。栗子1号：假设我是一家KTV的老板，我同时拥有5家KTV，我肯定得时刻监视
Spring之使用事务缘由(2-注解实现) ihuning spring
Spring事务注解实现 1. 依赖包： 1.1 spring包： spring-beans-4.0.0.RELEASE.jar spring-context-4.0.0.
iOS App Launch Option 啸笑天 option
iOS 程序启动时总会调用application:didFinishLaunchingWithOptions:，其中第二个参数launchOptions为NSDictionary类型的对象，里面存储有此程序启动的原因。 launchOptions中的可能键值见UIApplication Class Reference的Launch Options Keys节。 1、若用户直接
jdk与jre的区别（_） macroli java jvm jdk
简单的说JDK是面向开发人员使用的SDK，它提供了Java的开发环境和运行环境。SDK是Software Development Kit 一般指软件开发包，可以包括函数库、编译程序等。 JDK就是Java Development Kit JRE是Java Runtime Enviroment是指Java的运行环境，是面向Java程序的使用者，而不是开发者。如果安装了JDK，会发同你
Updates were rejected because the tip of your current branch is behind qiaolevip 学习永无止境每天进步一点点众观千象 git
$ git push joe prod-2295-1 To [email protected]:joe.le/dr-frontend.git ! [rejected] prod-2295-1 -> prod-2295-1 (non-fast-forward) error: failed to push some refs to '[email protected]
[一起学Hive]之十四-Hive的元数据表结构详解 superlxw1234 hive hive元数据结构
关键字：Hive元数据、Hive元数据表结构之前在 “[一起学Hive]之一–Hive概述，Hive是什么”中介绍过，Hive自己维护了一套元数据，用户通过HQL查询时候，Hive首先需要结合元数据，将HQL翻译成MapReduce去执行。本文介绍一下Hive元数据中重要的一些表结构及用途，以Hive0.13为例。文章最后面，会以一个示例来全面了解一下，
Spring 3.2.14，4.1.7，4.2.RC2发布 wiselyman Spring 3
Spring 3.2.14、4.1.7及4.2.RC2于6月30日发布。其中Spring 3.2.1是一个维护版本(维护周期到2016-12-31截止)，后续会继续根据需求和bug发布维护版本。此时，Spring官方强烈建议升级Spring框架至4.1.7 或者将要发布的4.2 。其中Spring 4.1.7主要包含这些更新内容。

HNU-数据挖掘-作业1

数据挖掘课程作业作业1

第一题

第二题

a.计算四种距离并给出各自排名

b.规格化数据集并在变换后重新用欧几里得距离排序

第三题

第四题

a. 等频（等深）划分：

b. 等宽划分：

c. 聚类：

你可能感兴趣的:(#,【专选】数据挖掘,数据挖掘,人工智能)

数据挖掘课程作业
作业1