Is code

【数据分析必学】一文精通mapclassify：专业空间数据分类技术与地图可视化实战指南

引言

在地理数据可视化领域，如何合理地将连续数据划分为离散区间，直接决定了地图的表现力和准确性。一张优秀的专题地图（如人口密度图、收入分布图）背后，往往蕴含着精心设计的数据分类方案。mapclassify作为Python生态中专门用于空间数据分类的库，提供了丰富的分类算法和工具，帮助地图制作者科学、合理地表达空间数据。本文将全面解析mapclassify的使用方法及实战技巧，帮助你掌握专业的空间数据分类能力。

1. 为什么需要mapclassify？

在制作专题地图时，我们通常需要将连续的数值数据（如人口密度、GDP、温度等）转换为有限的几个类别，并用不同的颜色或图案表示。这个过程被称为"数据分类"或"数据离散化"。

1.1 数据分类的重要性

简化复杂性：将连续数据简化为少数几个类别，使地图更易于理解
突出模式：合适的分类方法可以突显数据的空间模式和异常值
控制视觉效果：不同的分类方法会产生不同的视觉效果，影响读图者的理解

1.2 不当分类的风险

选择不恰当的分类方法可能会：

掩盖重要的数据特征
夸大不重要的模式
误导地图读者
无法准确反映空间现象的分布规律

1.3 环境配置

# 安装必要的库
!pip install mapclassify geopandas matplotlib contextily numpy pandas

# 导入库
import mapclassify as mc
import geopandas as gpd
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import contextily as ctx
from matplotlib.colors import LinearSegmentedColormap

2. mapclassify的核心分类方法

mapclassify提供了多种分类算法，每种算法适用于不同的数据分布和可视化目标。

2.1 等间距分类法 (Equal Interval)

将数据范围划分为大小相等的区间。

# 生成示例数据
np.random.seed(42)
data = np.random.gamma(3, 2, 100)  # 偏斜分布的数据

# 应用等间距分类
equal_interval = mc.EqualInterval(data, k=5)
print("等间距分类边界:", equal_interval.bins)
print("每个类别的数据数量:", equal_interval.counts)

# 可视化分类结果
plt.figure(figsize=(10, 6))
plt.hist(data, bins=20, alpha=0.5, color='gray')
for edge in equal_interval.bins:
    plt.axvline(edge, color='red', linestyle='--')
plt.title('等间距分类法 (Equal Interval)')
plt.xlabel('数值')
plt.ylabel('频数')
plt.show()

优点：

计算简单，容易理解
适合均匀分布的数据
不同地图之间可以直接比较

缺点：

对于偏斜分布的数据，某些类别可能包含很少或没有数据
可能无法很好地反映数据的分布特征

适用场景：

均匀分布的数据（如温度、海拔等）
需要在多个地图之间进行比较的情况
数据范围和意义已被广泛接受（如0-100%的比例数据）

2.2 分位数分类法 (Quantile)

确保每个类别包含相同数量的观测值。

# 应用分位数分类
quantile = mc.Quantiles(data, k=5)
print("分位数分类边界:", quantile.bins)
print("每个类别的数据数量:", quantile.counts)

# 可视化分类结果
plt.figure(figsize=(10, 6))
plt.hist(data, bins=20, alpha=0.5, color='gray')
for edge in quantile.bins:
    plt.axvline(edge, color='green', linestyle='--')
plt.title('分位数分类法 (Quantile)')
plt.xlabel('数值')
plt.ylabel('频数')
plt.show()

优点：

每个类别包含相同数量的数据点，避免空类别
对异常值不敏感
适合不均匀分布的数据

缺点：

可能会将相似值分到不同类别中
不同地图之间难以直接比较
可能导致视觉上的误导

适用场景：

偏斜分布的数据
需要确保每个类别有足够样本的情况
相对排名分析（如前20%、中间40%、后40%等）

2.3 自然断点分类法 (Jenks Natural Breaks)

最小化每个类内的方差，最大化类间的方差。

# 应用自然断点分类
natural_breaks = mc.NaturalBreaks(data, k=5)
print("自然断点分类边界:", natural_breaks.bins)
print("每个类别的数据数量:", natural_breaks.counts)

# 可视化分类结果
plt.figure(figsize=(10, 6))
plt.hist(data, bins=20, alpha=0.5, color='gray')
for edge in natural_breaks.bins:
    plt.axvline(edge, color='blue', linestyle='--')
plt.title('自然断点分类法 (Jenks Natural Breaks)')
plt.xlabel('数值')
plt.ylabel('频数')
plt.show()

优点：

最大限度地保留数据自然分组
边界位于数据的"断点"处，分类更合理
通常产生最佳的视觉效果

缺点：

计算复杂度高
每个数据集的分类都不同，难以在多个地图间比较
对异常值敏感

适用场景：

单一地图的优化表达
数据中存在明显的自然分组
探索性数据分析

2.4 标准差分类法 (Standard Deviation)

基于平均值和标准差来定义类别。

# 生成正态分布数据
np.random.seed(42)
normal_data = np.random.normal(100, 15, 200)

# 应用标准差分类
std_dev = mc.StdMean(normal_data)
print("标准差分类边界:", std_dev.bins)
print("每个类别的数据数量:", std_dev.counts)

# 可视化分类结果
plt.figure(figsize=(10, 6))
plt.hist(normal_data, bins=20, alpha=0.5, color='gray')
for edge in std_dev.bins:
    plt.axvline(edge, color='purple', linestyle='--')
plt.title('标准差分类法 (Standard Deviation)')
plt.xlabel('数值')
plt.ylabel('频数')
plt.show()

优点：

突显与均值的偏离程度
适合正态分布的数据
统计学意义明确

缺点：

不适合偏斜分布
类别数量通常固定为6或7个
需要数据近似正态分布

适用场景：

分析与平均值的偏差（如温度异常、降水偏差）
地理统计学分析
满足正态分布假设的数据

2.5 几何间隔分类法 (Fisher-Jenks)

Fisher-Jenks算法的最优实现，适合大数据集。

# Fisher-Jenks分类（优化的自然断点）
fisher_jenks = mc.FisherJenks(data, k=5)
print("Fisher-Jenks分类边界:", fisher_jenks.bins)
print("每个类别的数据数量:", fisher_jenks.counts)

# 可视化分类结果
plt.figure(figsize=(10, 6))
plt.hist(data, bins=20, alpha=0.5, color='gray')
for edge in fisher_jenks.bins:
    plt.axvline(edge, color='orange', linestyle='--')
plt.title('Fisher-Jenks分类法')
plt.xlabel('数值')
plt.ylabel('频数')
plt.show()

优点：

自然断点方法的高效实现
适合大型数据集
保留数据的自然分组

缺点：

与自然断点方法类似的局限性
计算开销仍然较大

适用场景：

大型空间数据集
需要优化计算性能的情况

2.6 其他分类方法

mapclassify还提供了许多其他分类方法：

# 头尾分割法（强调分布尾部）
headtail = mc.HeadTailBreaks(data)
print("头尾分割分类边界:", headtail.bins)
print("每个类别的数据数量:", headtail.counts)

# 最大间隔分类法
max_p = mc.MaximumBreaks(data, k=5)
print("最大间隔分类边界:", max_p.bins)
print("每个类别的数据数量:", max_p.counts)

# 用户自定义分类法
user_defined = mc.UserDefined(data, [5, 10, 15, 20])
print("用户自定义分类边界:", user_defined.bins)
print("每个类别的数据数量:", user_defined.counts)

3. 分类方法的比较与选择

不同的分类方法会产生不同的视觉效果。理解这些差异对于选择合适的分类方法至关重要。

3.1 多种方法的视觉对比

# 创建模拟数据集
np.random.seed(42)
data = np.concatenate([
    np.random.normal(50, 10, 80),    # 主体数据
    np.random.normal(100, 5, 20)     # 少量高值
])

# 应用多种分类方法
classifiers = {
    "等间距分类": mc.EqualInterval(data, k=5),
    "分位数分类": mc.Quantiles(data, k=5),
    "自然断点分类": mc.NaturalBreaks(data, k=5),
    "Fisher-Jenks分类": mc.FisherJenks(data, k=5)
}

# 可视化比较
fig, axes = plt.subplots(len(classifiers), 1, figsize=(12, 10), sharex=True)
plt.subplots_adjust(hspace=0.5)

for i, (name, classifier) in enumerate(classifiers.items()):
    axes[i].hist(data, bins=30, alpha=0.5, color='gray')
    for edge in classifier.bins:
        axes[i].axvline(edge, color=['red', 'green', 'blue', 'orange'][i], linestyle='--')
    axes[i].set_title(f'{name} (k=5)')
    axes[i].set_ylabel('频数')
    # 显示每个类别的数据量
    for j, count in enumerate(classifier.counts):
        if j < len(classifier.counts) - 1:
            x_pos = (classifier.bins[j] + classifier.bins[j+1]) / 2
            axes[i].text(x_pos, max(axes[i].get_ylim()) * 0.7, f'n={count}', 
                        ha='center', va='center', backgroundcolor='white')

axes[-1].set_xlabel('数值')
plt.tight_layout()
plt.show()

3.2 如何选择合适的分类方法

选择分类方法时，应考虑以下因素：

数据分布特征：
- 均匀分布：等间距分类
- 正态分布：标准差分类
- 偏斜分布：分位数分类或自然断点
- 多峰分布：自然断点分类
可视化目标：
- 突显异常值：头尾分割法
- 展示整体分布趋势：等间距或分位数
- 识别数据的自然分组：自然断点或Fisher-Jenks
- 强调均值偏差：标准差分类
地图用途：
- 探索性分析：自然断点或Fisher-Jenks
- 多地图比较：等间距或分位数
- 时间序列地图：固定间隔或用户自定义
受众群体：
- 专业分析人员：可使用复杂的分类方法
- 普通公众：优先选择易于理解的分类方法

4. 实际应用案例

4.1 使用真实数据：美国县级人口密度图

# 加载美国县级数据
usa = gpd.read_file(gpd.datasets.get_path('usa_counties'))

# 计算人口密度
usa['pop_density'] = usa['POP2010'] / usa['ALAND'] * 1000000  # 每平方公里人口

# 筛选出本土48州数据，排除极端异常值
usa_lower48 = usa[(usa['STATEFP'] != '02') & (usa['STATEFP'] != '15')]  # 排除阿拉斯加和夏威夷
usa_lower48 = usa_lower48[usa_lower48['pop_density'] < 5000]  # 排除极端高值

# 应用不同分类方法
classifiers = {
    "等间距分类": mc.EqualInterval(usa_lower48['pop_density'], k=5),
    "分位数分类": mc.Quantiles(usa_lower48['pop_density'], k=5),
    "自然断点分类": mc.NaturalBreaks(usa_lower48['pop_density'], k=5)
}

# 创建渐变色方案
colors = ['#ffffcc', '#c7e9b4', '#7fcdbb', '#41b6c4', '#1d91c0', '#225ea8']
cmap = LinearSegmentedColormap.from_list('custom_cmap', colors)

# 创建多子图比较
fig, axes = plt.subplots(1, 3, figsize=(18, 10))
plt.subplots_adjust(wspace=0.05)

for i, (name, classifier) in enumerate(classifiers.items()):
    # 分类并映射到颜色
    usa_lower48[f'class_{i}'] = classifier.yb
    
    # 绘制地图
    usa_lower48.plot(
        column=f'class_{i}',
        cmap=cmap,
        ax=axes[i],
        legend=True,
        legend_kwds={'title': '人口密度\n(人/平方公里)', 'loc': 'lower right'}
    )
    
    axes[i].set_title(name, fontsize=14)
    axes[i].set_axis_off()
    axes[i].set_xlim([-125, -65])
    axes[i].set_ylim([25, 50])

plt.suptitle('美国县级人口密度 - 不同分类方法比较', fontsize=18, y=0.95)
plt.tight_layout()
plt.show()

# 输出分类边界值
for name, classifier in classifiers.items():
    print(f"{name}边界值: {classifier.bins.round(1).tolist()}")

4.2 中国省级GDP地图

# 模拟中国省级GDP数据
provinces = gpd.read_file('china_provinces.geojson')  # 假设有这个文件
provinces['GDP'] = [91, 68, 44, 24, 39, 55, 77, 102, 42, 36, 27, 
                   58, 47, 62, 38, 49, 65, 29, 41, 67, 88, 
                   32, 72, 53, 44, 31, 48, 59, 39, 51, 47]  # 示例数据

# 使用自然断点分类
natural_breaks = mc.NaturalBreaks(provinces['GDP'], k=5)
provinces['GDP_class'] = natural_breaks.yb

# 创建地图
fig, ax = plt.subplots(1, 1, figsize=(12, 10))
provinces.plot(
    column='GDP_class',
    cmap='OrRd',
    linewidth=0.5,
    ax=ax,
    edgecolor='black',
    legend=True,
    legend_kwds={'title': 'GDP分类\n(万亿元)'}
)

# 添加省名标签
for idx, row in provinces.iterrows():
    ax.annotate(row['name'], xy=(row.geometry.centroid.x, row.geometry.centroid.y),
               ha='center', va='center', fontsize=8)

ax.set_title('中国省级GDP分布图 (自然断点分类)', fontsize=15)
ax.set_axis_off()
plt.tight_layout()
plt.show()

5. 与其他地理库集成

5.1 与GeoPandas集成

mapclassify与GeoPandas无缝集成，可以直接在GeoPandas的plot函数中使用：

# 使用mapclassify自动执行分类
usa_lower48.plot(
    column='pop_density',
    scheme='NaturalBreaks',  # 使用自然断点分类
    k=5,                    # 分类数量
    cmap='Blues',           # 色彩方案
    legend=True,
    figsize=(12, 8)
)
plt.title('美国县级人口密度 (自然断点分类)', fontsize=15)
plt.axis('off')
plt.show()

# 使用分位数分类绘制人口图
usa_lower48.plot(
    column='pop_density',
    scheme='Quantiles',     # 使用分位数分类
    k=5,                    # 分类数量
    cmap='YlOrRd',          # 色彩方案
    legend=True,
    figsize=(12, 8)
)
plt.title('美国县级人口密度 (分位数分类)', fontsize=15)
plt.axis('off')
plt.show()

5.2 与matplotlib和contextily集成

# 使用自定义分类方法并添加底图
fig, ax = plt.subplots(1, 1, figsize=(12, 10))

# 选择东部地区绘制更详细的地图
eastern_states = usa_lower48[usa_lower48.geometry.centroid.x > -90]

# 应用Fisher-Jenks分类
fj = mc.FisherJenks(eastern_states['pop_density'], k=6)
eastern_states['density_class'] = fj.yb

# 绘制地图
eastern_states.to_crs(epsg=3857).plot(
    column='density_class',
    categorical=True,
    cmap='viridis',
    linewidth=0.5,
    edgecolor='black',
    alpha=0.7,
    ax=ax
)

# 添加底图
ctx.add_basemap(ax)

# 添加标题和说明
plt.title('美国东部地区人口密度 (Fisher-Jenks分类)', fontsize=15)
plt.axis('off')

# 添加自定义图例
import matplotlib.patches as mpatches

# 获取分类边界
bounds = np.round(fj.bins, 1)
bounds = np.insert(bounds, 0, np.round(eastern_states['pop_density'].min(), 1))

# 创建图例
patches = []
for i in range(len(bounds)-1):
    label = f'{bounds[i]} - {bounds[i+1]}'
    color = plt.cm.viridis(i/len(bounds))
    patches.append(mpatches.Patch(color=color, label=label))

plt.legend(handles=patches, title='人口密度\n(人/平方公里)', 
          loc='upper left', bbox_to_anchor=(1, 1))

plt.tight_layout()
plt.show()

6. 高级技巧与最佳实践

6.1 处理偏斜数据

对于高度偏斜的数据，常规分类方法可能效果不佳：

# 创建高度偏斜的数据
np.random.seed(42)
skewed_data = np.random.lognormal(0, 1, 1000)

# 原始数据的分类效果
classifiers = {
    "等间距分类": mc.EqualInterval(skewed_data, k=5),
    "分位数分类": mc.Quantiles(skewed_data, k=5),
    "自然断点分类": mc.NaturalBreaks(skewed_data, k=5),
    "头尾分割分类": mc.HeadTailBreaks(skewed_data)
}

fig, axes = plt.subplots(2, 2, figsize=(12, 8))
axes = axes.flatten()

for i, (name, classifier) in enumerate(classifiers.items()):
    axes[i].hist(skewed_data, bins=50, alpha=0.5, color='gray')
    for edge in classifier.bins:
        axes[i].axvline(edge, color=['red', 'green', 'blue', 'purple'][i], linestyle='--')
    axes[i].set_title(name)
    axes[i].set_yscale('log')  # 使用对数尺度以便更好地查看分布
    axes[i].set_xlim([0, 20])  # 限制x轴范围以便更好地查看主体分布
    
plt.tight_layout()
plt.show()

# 对数变换后再分类
log_data = np.log1p(skewed_data)  # log(1+x)变换

log_classifiers = {
    "对数变换后等间距分类": mc.EqualInterval(log_data, k=5),
    "对数变换后分位数分类": mc.Quantiles(log_data, k=5),
    "对数变换后自然断点分类": mc.NaturalBreaks(log_data, k=5)
}

fig, axes = plt.subplots(1, 3, figsize=(15, 5))

for i, (name, classifier) in enumerate(log_classifiers.items()):
    axes[i].hist(log_data, bins=50, alpha=0.5, color='gray')
    for edge in classifier.bins:
        axes[i].axvline(edge, color=['red', 'green', 'blue'][i], linestyle='--')
    axes[i].set_title(name)
    
plt.tight_layout()
plt.show()

# 将对数空间中的分类边界转换回原始空间
for name, classifier in log_classifiers.items():
    original_bins = np.expm1(classifier.bins)  # 逆变换 exp(x)-1
    print(f"{name}在原始空间中的边界值: {original_bins.round(2)}")

6.2 使用GOF（拟合优度）评估分类质量

mapclassify提供了GOF指标来评估分类方法的质量：

# 比较不同分类方法的GOF
np.random.seed(42)
test_data = np.random.gamma(2, 3, 200)  # 使用gamma分布作为测试数据

methods = {
    "等间距分类": mc.EqualInterval,
    "分位数分类": mc.Quantiles,
    "自然断点分类": mc.NaturalBreaks,
    "Fisher-Jenks分类": mc.FisherJenks
}

k_values = range(3, 10)  # 测试不同的k值
results = {}

for method_name, method_class in methods.items():
    gof_values = []
    for k in k_values:
        classifier = method_class(test_data, k=k)
        gof_values.append(classifier.goodness_of_fit())
    results[method_name] = gof_values

# 绘制GOF比较图
plt.figure(figsize=(10, 6))
for method_name, gof_values in results.items():
    plt.plot(k_values, gof_values, marker='o', label=method_name)
    
plt.xlabel('类别数量 (k)')
plt.ylabel('拟合优度 (GOF)')
plt.title('不同分类方法的拟合优度比较')
plt.grid(True, linestyle='--', alpha=0.7)
plt.legend()
plt.tight_layout()
plt.show()

6.3 制作专业级地图图例

# 使用自然断点分类并创建专业图例
data = np.random.gamma(2, 3, 100)
classifier = mc.NaturalBreaks(data, k=5)

# 模拟地图数据
np.random.seed(42)
x = np.random.rand(100)
y = np.random.rand(100)
values = data

fig, ax = plt.subplots(figsize=(10, 8))

# 为每个类别分配颜色
cmap = plt.cm.YlOrRd
boundaries = list(classifier.bins)
boundaries.insert(0, min(data))
norm = plt.Normalize(min(data), max(data))

# 绘制散点图，按类别着色
for i in range(len(boundaries)-1):
    mask = (values >= boundaries[i]) & (values <= boundaries[i+1])
    if i == len(boundaries)-2:  # 最后一个类别包含上边界
        mask = (values >= boundaries[i])
    ax.scatter(x[mask], y[mask], c=[cmap(norm(np.mean([boundaries[i], boundaries[i+1]]))], 
              label=f'{boundaries[i]:.1f} - {boundaries[i+1]:.1f}')

# 创建图例
ax.legend(title='数值分类', fontsize=8, title_fontsize=10,
         bbox_to_anchor=(1.05, 1), loc='upper left')

# 添加标题和轴标签
ax.set_title('自然断点分类示例', fontsize=15)
ax.set_xlabel('X轴')
ax.set_ylabel('Y轴')
ax.grid(True, linestyle='--', alpha=0.3)

plt.tight_layout()
plt.show()

6.4 分类方法的自动选择

# 根据数据特征自动选择分类方法
def auto_classifier(data, k=5):
    """根据数据特征自动选择合适的分类方法"""
    # 计算数据的偏度
    from scipy import stats
    skewness = stats.skew(data)
    
    # 检查是否接近正态分布
    normality = stats.shapiro(data)[1]  # p值
    
    # 检查是否有极端异常值
    q1, q3 = np.percentile(data, [25, 75])
    iqr = q3 - q1
    has_outliers = np.any((data < q1 - 1.5 * iqr) | (data > q3 + 1.5 * iqr))
    
    # 基于数据特征选择分类方法
    if normality > 0.05:  # 接近正态分布
        return mc.StdMean(data), "标准差分类 (正态分布)"
    elif abs(skewness) > 2 or has_outliers:  # 高度偏斜或有异常值
        if abs(skewness) > 4:  # 极端偏斜
            return mc.HeadTailBreaks(data), "头尾分割分类 (极端偏斜)"
        else:
            return mc.Quantiles(data, k=k), "分位数分类 (偏斜分布)"
    else:  # 中等偏斜
        return mc.NaturalBreaks(data, k=k), "自然断点分类 (默认选择)"

# 测试不同分布的数据
distributions = {
    "正态分布": np.random.normal(100, 15, 200),
    "均匀分布": np.random.uniform(0, 100, 200),
    "偏斜分布": np.random.gamma(2, 10, 200),
    "极端偏斜": np.random.lognormal(0, 1, 200),
    "双峰分布": np.concatenate([np.random.normal(30, 5, 100), np.random.normal(70, 5, 100)])
}

for name, data in distributions.items():
    classifier, method_name = auto_classifier(data)
    print(f"{name}: 自动选择 {method_name}")
    print(f"  分类边界: {classifier.bins.round(1)}")
    print(f"  各类别数据量: {classifier.counts}")
    print()

7. 综合实战案例：城市社会经济分析

7.1 多变量分类与地图可视化

# 假设有城市街区数据
# 创建模拟数据
np.random.seed(42)
n = 100  # 街区数量

# 创建网格状的几何形状
from shapely.geometry import Polygon
geometries = []
for i in range(10):
    for j in range(10):
        # 创建网格单元作为街区
        geometries.append(Polygon([(i, j), (i+1, j), (i+1, j+1), (i, j+1)]))

# 创建社会经济属性
data = {
    'income': np.random.lognormal(10, 0.5, n),  # 收入水平
    'education': np.random.normal(15, 3, n),    # 教育年限
    'housing': np.random.gamma(20, 1.5, n),     # 房价指数
    'age': np.random.normal(40, 10, n)          # 平均年龄
}

# 创建GeoDataFrame
blocks = gpd.GeoDataFrame(data, geometry=geometries)

# 对每个变量应用自然断点分类
for col in ['income', 'education', 'housing', 'age']:
    classifier = mc.NaturalBreaks(blocks[col], k=5)
    blocks[f'{col}_class'] = classifier.yb

# 创建多变量可视化
fig, axes = plt.subplots(2, 2, figsize=(15, 12))
axes = axes.flatten()

variables = ['income', 'education', 'housing', 'age']
cmaps = ['Reds', 'Blues', 'Greens', 'Purples']
titles = ['收入水平', '教育年限', '房价指数', '平均年龄']

for i, (var, cmap, title) in enumerate(zip(variables, cmaps, titles)):
    blocks.plot(
        column=f'{var}_class',
        cmap=cmap,
        linewidth=0.5,
        edgecolor='black',
        ax=axes[i],
        legend=True,
        legend_kwds={'title': title}
    )
    axes[i].set_title(title)
    axes[i].set_axis_off()

plt.suptitle('城市街区社会经济特征分析', fontsize=16, y=0.98)
plt.tight_layout()
plt.subplots_adjust(top=0.9)
plt.show()

7.2 创建复合指数并分类

# 创建社会经济综合指数
# 标准化变量
for col in ['income', 'education', 'housing', 'age']:
    blocks[f'{col}_std'] = (blocks[col] - blocks[col].mean()) / blocks[col].std()

# 创建综合指数 (示例: 收入和教育正向影响，年龄负向影响)
blocks['ses_index'] = (blocks['income_std'] * 0.4 + 
                      blocks['education_std'] * 0.4 - 
                      blocks['age_std'] * 0.2)

# 应用Fisher-Jenks分类
classifier = mc.FisherJenks(blocks['ses_index'], k=5)
blocks['ses_class'] = classifier.yb

# 绘制综合指数地图
fig, ax = plt.subplots(figsize=(10, 10))

blocks.plot(
    column='ses_class',
    cmap='RdYlBu_r',  # 红(低)到蓝(高)
    linewidth=0.5,
    edgecolor='black',
    ax=ax,
    legend=True,
    legend_kwds={'title': '社会经济\n综合指数'}
)

# 添加标题和注释
ax.set_title('城市街区社会经济综合指数分布', fontsize=15)
ax.set_axis_off()

# 添加说明文本
plt.figtext(0.15, 0.05, '注: 综合指数由收入(40%)、教育(40%)和年龄(-20%)加权合成',
            wrap=True, horizontalalignment='left', fontsize=10)

plt.tight_layout()
plt.show()

8. 总结与最佳实践

8.1 不同分类方法的适用场景总结

分类方法	适用场景	优点	缺点
等间距分类	均匀分布数据；多地图比较	简单易懂；便于比较	对偏斜数据效果差
分位数分类	偏斜分布；确保每类样本量相等	无空类别；稳定	可能合并不同特征；难以比较
自然断点分类	存在自然分组；单地图展示	反映数据结构；视觉效果好	计算复杂；难以比较
标准差分类	正态分布；偏差分析	统计意义明确	不适合非正态分布
Fisher-Jenks	大数据集；存在自然分组	优化的断点算法；效果好	计算开销大
头尾分割法	极端偏斜；长尾分布	突显高值	类别数不固定
用户自定义	特定阈值；政策分析	完全可控	需要领域知识

8.2 制作高质量专题地图的建议

了解你的数据:
- 检查数据分布（直方图、箱线图）
- 识别异常值和极端值
- 了解数据的自然分组特征
选择合适的分类方法:
- 基于数据特征和可视化目标
- 尝试多种方法并比较
- 对偏斜数据考虑预处理（如对数变换）
慎重选择类别数量:
- 通常3-7个类别最为合适
- 使用GOF指标辅助决策
- 考虑观众接受能力
注意色彩选择:
- 使用顺序色彩方案表示连续数据
- 确保色彩可分辨（包括对色盲友好）
- 与数据变化方向一致（如深色通常表示高值）
提供清晰的图例:
- 包含分类边界值
- 添加单位和说明
- 考虑使用易于理解的标签而非纯数字
考虑地图用途:
- 探索性分析可以突出模式
- 公众传播需要简洁明了
- 多地图比较需保持一致的分类方法

8.3 进阶学习方向

掌握了mapclassify的基础用法后，可以考虑以下进阶学习方向：

空间自相关分析：使用GeoDa、PySAL等工具分析空间模式
时空数据分类：处理时间序列数据的分类技术
多变量分类方法：如k-means聚类和主成分分析
交互式地图可视化：使用Folium、Dash等创建交互地图
地理加权回归：考虑空间位置的回归分析方法

参考资源

mapclassify官方文档: https://pysal.org/mapclassify/
GeoPandas官方文档: https://geopandas.org/
《GIS Cartography: A Guide to Effective Map Design》(Gretchen N. Peterson)
《Choropleth Maps Through the Years》(Cynthia Brewer)
《How to Lie with Maps》(Mark Monmonier)

通过本文的学习，你已经掌握了使用mapclassify进行空间数据分类的核心技术。合理的数据分类不仅能提升地图的视觉效果，更能准确传达空间数据的内在规律，是地理数据分析和可视化中不可或缺的技能。希望这些知识能够帮助你创建更加专业、精确的专题地图！

你可能感兴趣的:(技术技巧,#,地理数据处理与可视化,数据分析,分类,数据挖掘,mapclassify)

x86-64汇编语言训练程序与实战十除以十等于一
本文还有配套的精品资源，点击获取简介：汇编语言是一种低级语言，与机器代码紧密相关，特别适用于编写系统级代码及性能要求高的应用。nasm编译器是针对x86和x86-64架构的汇编语言编译器，支持多种语法风格和指令集。项目Euler提供数学和计算机科学问题，鼓励编程技巧应用，前100个问题的答案可共享。x86-64架构扩展了寄存器数量并引入新指令，提升了数据处理效率。学习汇编语言能够深入理解计算机底层
《玉骨遥》：大司命为什么不杀朱颜？原因没那么简单 windy天意晚晴
《玉骨遥》里，朱颜就是时影的命劫之人。重明与时影早就知道，他们一直瞒着大司命，如今大司命也知道了真相。可是大司命却没有杀朱颜，而是给朱颜下了诛心咒，还说时影的命劫已经破了，真的如此吗？1、计划总是赶不上变化的大司命从目前剧情来说，大司命还不如时影，他信心十足的事情总会有纰漏。他不让时影见命劫之女，结果时影还是遇上了。他想让时影走火入魔，一心复仇，结果时影在朱颜的劝说下放下了仇恨。大司命让时影开山收
（二）SAP Group Reporting (GR) 核心子模块功能及数据流向架构解析
数据如何从子公司流转到合并报表的全过程，即数据采集→合并引擎→报表输出，特别是HANA内存计算如何优化传统ETL瓶颈。SAPGroupReporting(GR)核心模块功能及数据流向的架构解析，涵盖核心组件、数据处理流程和关键集成点，适用于S/4HANA1809+版本：一、核心功能模块概览模块功能关键事务码/FioriApp数据采集(DataCollection)整合子公司财务数据（SAP/非SA
《极简思维》第三部分小洋苏兮
整理你的人际关系如何改善人际关系？摘录：因为人际关系问题是人们生活中不快乐的主要原因。感想：感觉这个说的挺对，之前我总是埋头学习，不管舍友不管自己的合作伙伴的一些事情，但实际上，这学期关注了之后好多了摘录：“亲密关系与社交会让你健康而快乐。这是基础。太过于关注成就或不太关心人际关系的人都不怎么快乐。基本上来说，人类就是建立在人脉关系上的。”感想：但是如果有时想的太多就不太好，要以一个开放的心态跟别
我不懂什么是爱，但我给你全部我拥有的香尧
因为怕黑，所以愿意陪伴在夜中行走的人，给他一点点的安全感。因为渴望温柔与爱，所以愿意为别的孩子付出爱与温柔。因为曾遭受侮辱和伤害，所以不以同样的方式施于其他人。如果你向别人出之以利刃，对方还了你爱与包容，真的不要感激他，真的不要赞美他。每一个被人伤害过的人心里都留下了一颗仇恨的种子，他也会想要有一天以眼还眼，以牙还牙。但他未让那颗种子生根发芽，他用一把心剑又一次刺向他自己，用他血荐仇恨，开出一朵温
别再讲道理啦，对方听不进去的方所
我之前写过一篇叫做《你总妄想改变他人》，然后就有朋友跟我说，有一些方法可以改变他人之类的。嗯，是这样，但是任何具体的问题，都要限定好语境，描述清楚前提条件，然后再表达观点，我的这位朋友的说法就犯了一刀切的错误，这样并不能让讨论正常展开（这篇我得先给她看看，不然可能会挨揍）。好了，hhhh，谁让她不能写文章呢，我就来再说一说吧。我前面说过，我们在学到一个道理、学会一种方法之后，总是迫不及待地想要去与
Git 与 GitHub 的对比与使用指南一念& 其它 git github
Git与GitHub的对比与使用指南在软件开发中，Git和GitHub是两个密切相关但本质不同的工具。下面我将逐步解释它们的定义、区别、核心概念以及如何协同使用，确保内容真实可靠，基于广泛的技术实践。1.什么是Git？Git是一个分布式版本控制系统，由LinusTorvalds于2005年创建。它的核心功能是跟踪代码文件的变化，帮助开发者管理项目历史记录、协作和回滚错误。Git是开源的，可以在本地
英伟达靠什么支撑起了4万亿？AI泡沫还能撑多久？
英伟达市值突破4万亿美元，既是AI算力需求爆发的直接体现，也暗含市场对未来的狂热预期。其支撑逻辑与潜在风险并存，而AI泡沫的可持续性则取决于技术、商业与地缘政治的复杂博弈。⚙️一、英伟达4万亿市值的核心支撑因素技术垄断与生态壁垒硬件优势：英伟达GPU在AI训练市场占有率超87%，H100芯片的FP16算力达1979TFLOPS，领先竞品3-5倍。CUDA生态：400万开发者构建的软件护城河，成为A
ARM 和 AMD 架构的区别 m0_69576880 arm开发 windows 架构
ARM架构和AMD架构是两种不同的计算机处理器架构，它们有以下几个主要区别：设计出发点、兼容性、性能特点、市场定价。设计出发点：①ARM构架：ARM架构最初是为嵌入式系统设计的，旨在提供低功耗和高效能的解决方案。它主要应用于移动设备、嵌入式系统和物联网设备②AMD架构：AMD架构是基于x86架构的扩展，旨在提供与Intel架构兼容的处理器。它主要用于台式机、服务器和工作站等计算机系统。兼容性：AR
Linux系统配置（应用程序） 1风天云月 Linux linux 应用程序编译安装 rpm http
目录前言一、应用程序概述1、命令与程序的关系2、程序的组成3、软件包封装类型二、RPM1、RPM概述2、RPM用法三、编译安装1、解包2、配置3、编译4、安装5、启用httpd服务结语前言在Linux中的应用程序被视为将软件包安装到系统中后产生的各种文档，其中包括可执行文件、配置文件、用户手册等内容，这些文档被组织为一个有机的整体，为用户提供特定的功能，因此对于“安装软件包”与“安装应用程序”这两
JVM 内存模型深度解析：原子性、可见性与有序性的实现练习时长两年半的程序员小胡 JVM 深度剖析：从面试考点到生产实践 jvm java 内存模型
在了解了JVM的基础架构和类加载机制后，我们需要进一步探索Java程序在多线程环境下的内存交互规则。JVM内存模型（JavaMemoryModel，JMM）定义了线程和主内存之间的抽象关系，它通过规范共享变量的访问方式，解决了多线程并发时的数据一致性问题。本文将从内存模型的核心目标出发，详解原子性、可见性、有序性的实现机制，以及volatile、synchronized等关键字在其中的作用。一、J
Flowable 实战落地核心：选型决策与坑点破解练习时长两年半的程序员小胡 Flowable 流程引擎实战指南低代码 BPMN 流程引擎 flowable 后端 java
在企业级流程引擎的落地过程中，选型的准确性和坑点的预见性直接决定项目成败。本文聚焦Flowable实战中最关键的“选型决策”与“常见坑点”，结合真实项目经验，提供可落地的解决方案。一、流程引擎选型：从业务本质出发1.1选型的三大核心维度企业在选择流程引擎时，需避免陷入“技术崇拜”，应回归业务本质。评估Flowable是否适用，可从三个维度判断：业务复杂度若流程涉及动态审批链（如按金额自动升级审批）
Flowable 高级扩展：自定义元素与性能优化实战练习时长两年半的程序员小胡 Flowable 流程引擎实战指南流程图 flowable BPMN 流程引擎 java
在前五篇文章中，我们从基础概念、流程设计、API实战、SpringBoot集成，到外部系统协同，逐步构建了Flowable的应用体系。但企业级复杂场景中，原生功能往往难以满足定制化需求——比如需要特殊的审批规则网关、与决策引擎联动实现动态路由，或是在高并发场景下优化流程引擎性能。本文将聚焦Flowable的高级扩展能力，详解如何自定义流程元素、集成规则引擎，并掌握大型系统中的性能调优策略。一、自定
互信息：理论框架、跨学科应用与前沿进展大千AI助手人工智能 Python #OTHER 人工智能深度学习算法互信息香农通信随机变量
1.起源与核心定义互信息（MutualInformation,MI）由克劳德·香农（ClaudeShannon）在1948年开创性论文《AMathematicalTheoryofCommunication》中首次提出，该论文奠定了现代信息论的基础。互信息用于量化两个随机变量之间的统计依赖关系，定义为：若已知一个随机变量的取值，能为另一个随机变量提供的信息量。数学上，对于离散随机变量XXX和YYY，
Java | 多线程经典问题 - 售票 Ada54
一、售票需求1）同一个票池2）多个窗口卖票，不能出售同一张票二、售票问题代码实现（线程与进程小总结，请戳：Java|线程和进程，创建线程）step1：定义SaleWindow类实现Runnable接口，覆盖run方法step2：实例化SaleWindow对象，创建Thread对象，将SaleWindow作为参数传给Thread类的构造函数，然后通过Thread.start()方法启动线程step3
企业级区块链平台Hyperchain核心原理剖析 boyedu 区块链区块链企业级区块链平台 Hyperchain
Hyperchain作为国产自主可控的企业级联盟区块链平台，其核心原理围绕高性能共识、隐私保护、智能合约引擎及可扩展架构展开，通过多模块协同实现企业级区块链网络的高效部署与安全运行。以下从核心架构、关键技术、性能优化、安全机制、应用场景五个维度展开剖析：一、核心架构：分层解耦与模块化设计Hyperchain采用分层架构，将区块链功能解耦为独立模块，支持灵活组合与扩展：P2P网络层由验证节点（VP）
JAVA接口机结构解析秃狼 SpringBoot 八股文 Java java 学习
什么是接口机在Java项目中，接口机通常指用于与外部系统进行数据交互的中间层，负责处理请求和响应的转换、协议适配、数据格式转换等任务。接口机的结构我们的接口机的结构分为两个大部分，外部接口机和内部接口机，在业务的调度上也是通过mq来实现的，只要的目的就是为了解耦合和做差异化。在接口机中主要的方法就是定时任务，消息的发送和消费，其他平台调用接口机只能提供外部接口机的方法进行调用，外部接口机可以提供消
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
氧惠官方邀请码333777，氧惠邀请码怎么获得？氧惠邀请码有什么套路？知行导师
问：氧惠邀请码怎么获得？答：氧惠官方邀请码333777返点高佣金高真的高。问：氧惠邀请码有什么套路？答：氧惠官方邀请码333777返点高佣金高真的高。氧惠APP汇聚各大主流电商和生活服务平台优惠，展示全网全品类商品，满足网购爱好者对品质好货与极致性价比的追求，并同时享受大平台购物权益保障。满足用户日常吃喝玩乐衣食住行的聚合APP，独特的商业模式，响应国家号召，为实现全民共富而努力奋斗。氧惠邀请码3
最新阿里四面面试真题46道：面试技巧+核心问题+面试心得风平浪静如码
前言做技术的有一种资历，叫做通过了阿里的面试。这些阿里Java相关问题，都是之前通过不断优秀人才的铺垫总结的，先自己弄懂了再去阿里面试，不然就是去丢脸，被虐。希望对大家帮助，祝面试成功，有个更好的职业规划。一，阿里常见技术面1、微信红包怎么实现。2、海量数据分析。3、测试职位问的线程安全和非线程安全。4、HTTP2.0、thrift。5、面试电话沟通可能先让自我介绍。6、分布式事务一致性。7、ni
深入理解汇编语言子程序设计与系统调用网安spinage 汇编语言开发语言汇编算法
本文将全面解析汇编语言中子程序设计的核心技术以及系统调用的实现方法，涵盖参数传递的多种方式、堆栈管理、API调用等关键知识点，并提供实际案例演示。一、子程序设计：参数传递的艺术1.寄存器传参：高效简洁.386.modelflat,stdcalloptioncasemap:none.dataxdd5;定义变量ydd6sumdd?.code;函数定义：addxy1addxy1procpushebpmo
【老房翻新】92平轻奢简约风，将和谐之美融入空间！没人比我更懂装修
在客厅空间中，设计师于冷静的空间基调中选用了层次感丰富的黄蓝色作为主要跳色，搭配黑白纹理的地毯与单椅，为空间增加了时尚摩登的气息。艺术感的单品突出点亮了空间，绿植的点缀、留白的软饰则增强了空间的呼吸性。点击此处添加图片说明文字点击此处添加图片说明文字设计师力求使每一处的设立都在空间中达到相互间的呼应与制衡，将艺术的跃动之美赋于空间之上，也将空间的和谐之美融于生活之中。点击此处添加图片说明文字点击此
京东家电年销售额是去年的1300%，主要来自于他.... Shanshan小课堂
经过大半个月角逐纠缠，时间终于来到6月18日，618全球年中购物节迎来最高潮。作为国内最大的家电零售平台，京东家电从18日0点开始，便开启了飞速狂奔的模式，仅8分钟销售额就突破20亿元!展现出强劲的增长势头与家电主场的王者霸气的同时，也让各家电品牌实现了爆发式增长，美的、海尔、格力、奥克斯均在3分钟内突破1亿元大关。在今年的618中，除了消费者已经熟悉的网购形式外，线上线下联动的融合模式、社交电商
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
图论算法经典题目解析：DFS、BFS与拓扑排序实战周童學数据结构与算法深度优先算法图论
图论算法经典题目解析：DFS、BFS与拓扑排序实战图论问题是算法面试中的高频考点，本博客将通过四道LeetCode经典题目（均来自"Top100Liked"题库），深入讲解图论的核心算法思想和实现技巧。涵盖DFS、BFS、拓扑排序和前缀树等知识点，每道题配有Java实现和易错点分析。1.岛屿数量(DFS遍历)问题描述给定一个由'1'(陆地)和'0'(水)组成的二维网格，计算岛屿的数量。岛屿由水平或
基于redis的Zset实现作者的轻量级排名周童學 Java redis 数据库缓存
基于redis的Zset实现轻量级作者排名系统在今天的技术架构中，Redis是一种广泛使用的内存数据存储系统，尤其在需要高效检索和排序的场景中表现优异。在本篇博客中，我们将深入探讨如何使用Redis的有序集合（ZSet）构建一个高效的笔记排行榜系统，并提供相关代码示例和详细的解析。1.功能背景与需求假设我们有一个笔记分享平台，用户可以发布各种笔记，系统需要根据用户发布的笔记数量来生成一个实时更新的
【项目实战】容错机制与故障恢复：保障系统连续性的核心体系本本本添哥 004 -研效与DevOps运维工具链 002 -进阶开发能力分布式
在分布式系统中，硬件故障、网络波动、软件异常等问题难以避免。容错机制与故障恢复的核心目标是：通过主动检测故障、自动隔离风险、快速转移负载、重建数据一致性，最大限度减少故障对业务的影响，保障系统“持续可用”与“数据不丢失”。以下从核心机制、实现方式、典型案例等维度展开说明。一、故障检测：及时发现异常节点故障检测是容错的第一步，需通过多维度手段实时感知系统组件状态，确保故障被快速识别。1.健康检查与心
Java并发核心：线程池使用技巧与最佳实践！ | 多线程篇(五) bug菌¹ Java实战(进阶版)java Java零基础入门 Java并发线程池多线程篇
本文收录于「Java进阶实战」专栏，专业攻坚指数级提升，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！环境说明：Windows10+IntelliJIDEA2021.3.2+Jdk1.8本文目录前言摘要正文何为线程池？为什么需要线程池？线程池的好处线程池使用场景如何创建线程池？线程池的常见配置源码解析案例分享案例代码演示案例运行
D2早课与活力链接亲爱的lingling
宇宙法则是：关注什么，什么就会变大。所以时刻关注自己在想什么，听什么，看什么！感恩今天早晨醒来的第一个意识是，真好，美好的一天开始了，我要越来越漂亮。起床做感恩冥想，呼吸法，喝一杯白开水，贴牛奶面膜。谢谢真我，感觉真好！感恩今天芳哥哥做的爱心早餐，给我煎了鸡蛋，谢谢芳哥的付出。谢谢！感恩我能够越来越清晰自己要做什么，越来越清楚知道自己想要的是什么，更加宁静与喜悦。今天早晨我听到我的高级智慧的声音，
Java 队列 tryxr java 开发语言队列
队列一般用什么哪种结构实现队列的特性数据入队列时一定是从尾部插入吗数据出队列时一定是从头部删除吗队列的基本运算有什么队列支持随机访问吗队列的英文表示什么是队列队列从哪进、从哪出队列的进出顺序队列是用哪种结构实现的Queue和Deque有什么区别Queue接口的方法Queue中的add与offer的区别offer、poll、peek的模拟实现如何利用链表实现队列如何利用顺序表实现队列什么叫做双端队列
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI PHP android linux
╔-----------------------------------╗┆
各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。 bozch .net .net mvc
在.net mvc5中，在执行某一操作的时候，出现了如下错误：各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。经查询当前的操作与错误内容无关，经过对错误信息的排查发现，事故出现在数据库迁移上。回想过去：在迁移之前已经对数据库进行了添加字段操作，再次进行迁移插入XXX字段的时候，就会提示如上错误。 &
Java 对象大小的计算 e200702084 java
Java对象的大小如何计算一个对象的大小呢？
Mybatis Spring 171815164 mybatis
ApplicationContext ac = new ClassPathXmlApplicationContext("applicationContext.xml"); CustomerService userService = (CustomerService) ac.getBean("customerService"); Customer cust
JVM 不稳定参数 g21121 jvm
-XX 参数被称为不稳定参数，之所以这么叫是因为此类参数的设置很容易引起JVM 性能上的差异，使JVM 存在极大的不稳定性。当然这是在非合理设置的前提下，如果此类参数设置合理讲大大提高JVM 的性能及稳定性。可以说“不稳定参数”
用户自动登录网站永夜-极光用户
1.目标:实现用户登录后,再次登录就自动登录,无需用户名和密码 2.思路:将用户的信息保存为cookie 每次用户访问网站,通过filter拦截所有请求,在filter中读取所有的cookie,如果找到了保存登录信息的cookie,那么在cookie中读取登录信息,然后直接
centos7 安装后失去win7的引导记录程序员是怎么炼成的操作系统
1.使用root身份(必须)打开 /boot/grub2/grub.cfg 2.找到 ### BEGIN /etc/grub.d/30_os-prober ### 在后面添加 menuentry "Windows 7 (loader) (on /dev/sda1)" {
Oracle 10g 官方中文安装帮助文档以及Oracle官方中文教程文档下载 aijuans oracle
Oracle 10g 官方中文安装帮助文档下载：http://download.csdn.net/tag/Oracle%E4%B8%AD%E6%96%87API%EF%BC%8COracle%E4%B8%AD%E6%96%87%E6%96%87%E6%A1%A3%EF%BC%8Coracle%E5%AD%A6%E4%B9%A0%E6%96%87%E6%A1%A3 Oracle 10g 官方中文教程
JavaEE开源快速开发平台G4Studio_V3.2发布了無為子 AOP oracle mysql javaee G4Studio
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V3.2版本已经正式发布。大家可以通过如下地址下载。访问G4Studio网站 http://www.g4it.org G4Studio_V3.2版本变更日志功能新增 (1).新增了系统右下角滑出提示窗口功能。 (2).新增了文件资源的Zip压缩和解压缩
Oracle常用的单行函数应用技巧总结百合不是茶日期函数转换函数(核心)数字函数通用函数(核心)字符函数
单行函数; 字符函数,数字函数,日期函数,转换函数(核心),通用函数(核心) 一:字符函数: .UPPER(字符串) 将字符串转为大写 .LOWER (字符串) 将字符串转为小写 .INITCAP(字符串) 将首字母大写 .LENGTH (字符串) 字符串的长度 .REPLACE(字符串,'A','_') 将字符串字符A转换成_
Mockito异常测试实例 bijian1013 java 单元测试 mockito
Mockito异常测试实例： package com.bijian.study; import static org.mockito.Mockito.mock; import static org.mockito.Mockito.when; import org.junit.Assert; import org.junit.Test; import org.mockito.
GA与量子恒道统计 Bill_chen JavaScript 浏览器百度 Google 防火墙
前一阵子，统计**网址时，Google Analytics（GA）和量子恒道统计（也称量子统计），数据有较大的偏差，仔细找相关资料研究了下，总结如下：为何GA和量子网站统计（量子统计前身为雅虎统计）结果不同？首先：没有一种网站统计工具能保证百分之百的准确出现该问题可能有以下几个原因：（1）不同的统计分析系统的算法机制不同；（2）统计代码放置的位置和前后
【Linux命令三】Top命令 bit1129 linux命令
Linux的Top命令类似于Windows的任务管理器，可以查看当前系统的运行情况，包括CPU、内存的使用情况等。如下是一个Top命令的执行结果： top - 21:22:04 up 1 day, 23:49, 1 user, load average: 1.10, 1.66, 1.99 Tasks: 202 total, 4 running, 198 sl
spring四种依赖注入方式白糖_ spring
平常的java开发中，程序员在某个类中需要依赖其它类的方法，则通常是new一个依赖类再调用类实例的方法，这种开发存在的问题是new的类实例不好统一管理，spring提出了依赖注入的思想，即依赖类不由程序员实例化，而是通过spring容器帮我们new指定实例并且将实例注入到需要该对象的类中。依赖注入的另一种说法是“控制反转”，通俗的理解是：平常我们new一个实例，这个实例的控制权是我
angular.injector boyitech AngularJS AngularJS API
angular.injector 描述: 创建一个injector对象, 调用injector对象的方法可以获得angular的service, 或者用来做依赖注入. 使用方法: angular.injector(modules, [strictDi]) 参数详解: Param Type Details mod
java-同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待 bylijinnan Integer
public class PC { /** * 题目：生产者-消费者。 * 同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待。 */ private static final Integer[] val=new Integer[10]; private static
使用Struts2.2.1配置 Chen.H apache spring Web xml struts
Struts2.2.1 需要如下 jar包: commons-fileupload-1.2.1.jar commons-io-1.3.2.jar commons-logging-1.0.4.jar freemarker-2.3.16.jar javassist-3.7.ga.jar ognl-3.0.jar spring.jar struts2-core-2.2.1.jar struts2-sp
[职业与教育]青春之歌 comsci 教育
每个人都有自己的青春之歌............但是我要说的却不是青春... 大家如果在自己的职业生涯没有给自己以后创业留一点点机会,仅仅凭学历和人脉关系,是难以在竞争激烈的市场中生存下去的.... &nbs
oracle连接(join)中使用using关键字 daizj JOIN oracle sql using
在oracle连接(join)中使用using关键字 34. View the Exhibit and examine the structure of the ORDERS and ORDER_ITEMS tables. Evaluate the following SQL statement: SELECT oi.order_id, product_id, order_date FRO
NIO示例 daysinsun nio
NIO服务端代码： public class NIOServer { private Selector selector; public void startServer(int port) throws IOException { ServerSocketChannel serverChannel = ServerSocketChannel.open(
C语言学习homework1 dcj3sjt126com c homework
0、课堂练习做完 1、使用sizeof计算出你所知道的所有的类型占用的空间。 int x; sizeof(x); sizeof(int); # include <stdio.h> int main(void) { int x1; char x2; double x3; float x4; printf(&quo
select in order by , mysql排序 dcj3sjt126com mysql
If i select like this: SELECT id FROM users WHERE id IN(3,4,8,1); This by default will select users in this order 1,3,4,8, I would like to select them in the same order that i put IN() values so:
页面校验-新建项目 fanxiaolong 页面校验
$(document).ready( function() { var flag = true; $('#changeform').submit(function() { var projectScValNull = true; var s =""; var parent_id = $("#parent_id").v
Ehcache（02）——ehcache.xml简介 234390216 ehcache ehcache.xml 简介
ehcache.xml简介 ehcache.xml文件是用来定义Ehcache的配置信息的，更准确的来说它是定义CacheManager的配置信息的。根据之前我们在《Ehcache简介》一文中对CacheManager的介绍我们知道一切Ehcache的应用都是从CacheManager开始的。在不指定配置信
junit 4.11中三个新功能 jackyrong java
junit 4.11中两个新增的功能，首先是注解中可以参数化，比如 import static org.junit.Assert.assertEquals; import java.util.Arrays; import org.junit.Test; import org.junit.runner.RunWith; import org.junit.runn
国外程序员爱用苹果Mac电脑的10大理由 php教程分享 windows PHP unix Microsoft perl
Mac 在国外很受欢迎，尤其是在设计/web开发/IT 人员圈子里。普通用户喜欢 Mac 可以理解，毕竟 Mac 设计美观，简单好用，没有病毒。那么为什么专业人士也对 Mac 情有独钟呢？从个人使用经验来看我想有下面几个原因： 1、Mac OS X 是基于 Unix 的这一点太重要了，尤其是对开发人员，至少对于我来说很重要，这意味着Unix 下一堆好用的工具都可以随手捡到。如果你是个 wi
位运算、异或的实际应用 wenjinglian 位运算
一．位操作基础，用一张表描述位操作符的应用规则并详细解释。二．常用位操作小技巧，有判断奇偶、交换两数、变换符号、求绝对值。三．位操作与空间压缩，针对筛素数进行空间压缩。 &n
weblogic部署项目出现的一些问题（持续补充中……） Everyday都不同 weblogic部署失败
好吧，weblogic的问题确实…… 问题一： org.springframework.beans.factory.BeanDefinitionStoreException: Failed to read candidate component class: URL [zip:E:/weblogic/user_projects/domains/base_domain/serve
tomcat7性能调优（01） toknowme tomcat7
Tomcat优化： 1、最大连接数最大线程等设置 <Connector port="8082" protocol="HTTP/1.1" useBodyEncodingForURI="t
PO VO DAO DTO BO TO概念与区别 xp9802 java DAO 设计模式 bean 领域模型
O/R Mapping 是 Object Relational Mapping（对象关系映射）的缩写。通俗点讲，就是将对象与关系数据库绑定，用对象来表示关系数据。在O/R Mapping的世界里，有两个基本的也是重要的东东需要了解，即VO，PO。它们的关系应该是相互独立的，一个VO可以只是PO的部分，也可以是多个PO构成，同样也可以等同于一个PO（指的是他们的属性）。这样，PO独立出来，数据持