Natsume1710

构建量化交易系统核心技术栈详解：从数据到实盘的全链路实践（含代码）

1. 引言

量化交易系统是一个集数据处理、策略研究、高速执行、风险控制及系统运维于一体的复杂工程。本文旨在为读者提供一个从零开始构建量化交易系统的实践指南，详细阐述其核心技术栈，并通过具体的代码示例，帮助开发者深入理解每个模块的实现细节和技术选型考量。

我们将系统分为五个核心层级进行讲解：数据层、策略研究与回测层、交易执行层、风险管理层，以及监控与运维层。每个层级都将探讨其主要功能、涉及的技术挑战及相应的技术解决方案，并辅以Python或C++代码进行演示。

2. 数据层：量化交易系统的基石

数据是量化交易系统的生命线。高质量、低延迟的数据是策略有效性的前提。数据层主要负责数据的采集、清洗、存储和内部传输。

2.1 数据采集与清洗

数据源多样，包括交易所API、券商API、第三方数据服务商或自建爬虫。原始数据常包含缺失值、异常值、格式不统一等问题，需要进行严格清洗和预处理。

技术选型： Python是数据采集和清洗的主流语言，尤其Pandas库提供了强大的数据处理能力。
代码示例：使用Pandas进行数据清洗

# 数据清洗示例：处理缺失值与异常值
import pandas as pd
import numpy as np

# 模拟原始K线数据，包含NaN和异常大值
raw_kline_data = pd.DataFrame({
    'timestamp': pd.to_datetime(['2023-01-01', '2023-01-01', '2023-01-02', '2023-01-02', '2023-01-03']),
    'symbol': ['AAPL', 'GOOG', 'AAPL', 'GOOG', 'AAPL'],
    'close_price': [170.0, 95.0, 171.5, np.nan, 172.0], # 模拟缺失值
    'volume': [1000, 2000, 1200, 50000000, 1500] # 模拟异常值
})

print("--- 原始数据 ---")
print(raw_kline_data)

# 1. 缺失值处理：使用前一个有效值填充（ffill）
cleaned_data = raw_kline_data.fillna(method='ffill')

# 2. 异常值处理：例如，将交易量超过某个阈值的视为异常并处理
volume_anomaly_threshold = 1_000_000
cleaned_data['volume'] = cleaned_data['volume'].apply(lambda x: x if x < volume_anomaly_threshold else np.nan)
cleaned_data['volume'] = cleaned_data['volume'].fillna(method='ffill') # 再次填充处理异常后产生的NaN

# 3. 确保数据类型正确性
cleaned_data['close_price'] = pd.to_numeric(cleaned_data['close_price'])
cleaned_data['volume'] = pd.to_numeric(cleaned_data['volume'], errors='coerce') # coerce会将无法转换的值设为NaN

print("\n--- 清洗后的数据 ---")
print(cleaned_data)

2.2 数据存储方案

根据数据特性选择合适的存储方案，以实现高效的写入和查询。

时序数据库 (TSDB)： 适用于高频行情数据（Tick、K线），例如KDB+ (高性能商业数据库) 或 InfluxDB (开源)。它们针对时间序列数据的写入和查询进行了优化。
关系型数据库 (RDBMS)： 适用于基本面数据、财务数据、交易记录等结构化数据，如PostgreSQL、MySQL。
文件存储： 对于大规模数据集或需要高效批量读写场景，可采用HDF5、Parquet等列式存储格式。
代码示例：时序数据库写入（伪代码）

# 示例：向时序数据库写入Tick数据（伪代码）
# 实际操作需调用具体TSDB客户端API，如 InfluxDB-Python
from datetime import datetime

def write_tick_to_tsdb(timestamp: datetime, symbol: str, price: float, volume: int):
    """
    模拟将Tick数据写入时序数据库。
    在实际系统中，这将通过RPC调用或数据库客户端API完成。
    """
    data_point = {
        "measurement": "stock_ticks",  # 测量名称
        "time": timestamp,             # 时间戳
        "tags": {"symbol": symbol},    # 标签，用于快速过滤
        "fields": {"price": price, "volume": volume} # 字段数据
    }
    # client.write_points([data_point]) # 实际的数据库写入操作
    print(f"[TSDB] 写入: 时间={timestamp}, 标的={symbol}, 价格={price}, 量={volume}")

# 示例调用
# write_tick_to_tsdb(datetime.now(), "NVDA", 1000.5, 500)

2.3 数据传输机制

系统内部各模块之间的数据传输需要高效、低延迟。

消息队列 (Message Queue)： 实现模块间异步解耦和数据流分发。Redis的Pub/Sub模式、Kafka、ZeroMQ等是常用选择。
共享内存： 在同一服务器内实现进程间超低延迟通信。
代码示例：Redis Pub/Sub实现数据传输（Python）

# 示例：使用Redis Pub/Sub实现模块间数据通信
import redis
import json
import time
import threading

# 假设Redis服务器运行在本地默认端口
r = redis.Redis(host='localhost', port=6379, db=0)
CHANNEL_NAME = 'market_data_feed'

# 模拟一个数据发布者（如行情接收模块）
def data_publisher():
    print("[Publisher] 启动行情数据发布...")
    for i in range(5):
        data = {"symbol": "BTC", "price": 60000.0 + i * 100.0, "timestamp": time.time()}
        r.publish(CHANNEL_NAME, json.dumps(data)) # 发布JSON格式数据
        print(f"[Publisher] 发布数据: {data}")
        time.sleep(0.5)
    print("[Publisher] 数据发布结束。")

# 模拟一个数据订阅者（如策略模块）
def data_subscriber():
    print("[Subscriber] 启动策略模块订阅行情...")
    pubsub = r.pubsub()
    pubsub.subscribe(CHANNEL_NAME) # 订阅指定频道

    for message in pubsub.listen(): # 循环监听消息
        if message['type'] == 'message':
            decoded_data = json.loads(message['data'].decode('utf-8'))
            print(f"[Subscriber] 接收到行情: {decoded_data}")
            # 实际策略会在这里处理行情数据，生成交易信号

# 在多线程中运行发布者和订阅者以演示并发
if __name__ == "__main__":
    publisher_thread = threading.Thread(target=data_publisher)
    subscriber_thread = threading.Thread(target=data_subscriber)

    publisher_thread.start()
    subscriber_thread.start()

    # 等待发布者完成，订阅者会持续监听直到程序关闭
    publisher_thread.join()
    # 实际应用中订阅者线程会长时间运行
    # subscriber_thread.join() # 这里不join订阅者，让其保持监听

3. 策略研究与回测层：量化思想的验证平台

本层负责将量化交易思想转化为可执行的策略代码，并在历史数据上进行模拟验证（回测），以评估策略的有效性和鲁棒性。

3.1 策略开发语言与库

Python： 作为数据科学和机器学习的主流语言，Python凭借其丰富的库（Pandas, NumPy, SciPy, Scikit-learn, TensorFlow/PyTorch）成为策略开发的首选。
R/Julia： 在统计建模和数值计算领域也有应用。

3.2 回测框架与实现

回测框架提供了一个模拟真实市场环境的“沙盘”，用于测试策略。它会按时间顺序处理历史数据，模拟订单撮合、资金管理等过程。

主流框架： Backtrader、Zipline、PyAlgoTrade、vn.py（国产优秀框架）等。
代码示例：Python策略逻辑骨架（简易均线策略）

# 示例：Python策略逻辑骨架（简易均线策略）
# 这是一个概念性示例，实际回测框架会提供更完善的API
class SimpleMovingAverageStrategy:
    def __init__(self, short_period: int = 10, long_period: int = 30):
        """
        策略初始化。
        :param short_period: 短期均线周期
        :param long_period: 长期均线周期
        """
        self.short_period = short_period
        self.long_period = long_period
        self.price_history = []  # 存储历史收盘价
        self.has_position = False # 当前是否有持仓

    def on_bar(self, bar_data: dict):
        """
        每当收到新的K线数据时被调用。
        :param bar_data: 包含'close'价格等信息的字典
        """
        current_price = bar_data['close']
        self.price_history.append(current_price)

        # 确保历史数据足够计算均线
        if len(self.price_history) < self.long_period:
            return

        # 计算短期和长期均线
        short_ma = sum(self.price_history[-self.short_period:]) / self.short_period
        long_ma = sum(self.price_history[-self.long_period:]) / self.long_period

        print(f"当前价格: {current_price:.2f}, 短均线({self.short_period}): {short_ma:.2f}, 长均线({self.long_period}): {long_ma:.2f}")

        # 交易逻辑：金叉买入，死叉卖出
        if short_ma > long_ma and not self.has_position:
            # 模拟下单：self.send_order(symbol="STOCK_XYZ", quantity=100, type="BUY")
            print(f"--> 金叉信号：买入 @ {current_price:.2f}")
            self.has_position = True
        elif short_ma < long_ma and self.has_position:
            # 模拟下单：self.send_order(symbol="STOCK_XYZ", quantity=100, type="SELL")
            print(f"--> 死叉信号：卖出 @ {current_price:.2f}")
            self.has_position = False

    def on_order_filled(self, order_info: dict):
        """订单成交事件处理"""
        print(f"订单成交: {order_info}")

    def on_error(self, error_msg: str):
        """错误事件处理"""
        print(f"策略错误: {error_msg}")

# 实际回测引擎会加载历史数据，并按顺序调用策略的on_bar等方法
# backtest_engine = SomeBacktestFramework(data, SimpleMovingAverageStrategy())
# results = backtest_engine.run()

3.3 回测中的常见问题与应对

未来函数 (Look-Ahead Bias)： 策略不小心使用了未来才能获得的数据。严格审查数据加载和指标计算过程是关键。
过度拟合 (Overfitting)： 策略在历史数据上表现完美，但在新数据上失效。通过样本外测试、交叉验证、减少模型复杂度等方法应对。

4. 交易执行层：策略指令的高效落地

交易执行层是量化系统与市场直接交互的模块，其核心目标是低延迟、高吞吐、高可靠性地执行交易指令。

4.1 执行引擎语言选型

C++： 高频交易（HFT）领域的首选，提供极致的性能控制和内存管理能力。
Go： 在并发处理、性能和开发效率之间取得良好平衡，适用于中高频和微服务架构。
Java： 在传统金融机构后台系统中应用广泛，以其稳定性著称。

4.2 高性能网络通信

与交易所或券商的交易网关通信，对网络延迟有极高要求。

FIX Protocol： 金融信息交换协议，行业标准。需使用高效的FIX协议库。
Socket编程： 底层网络通信，可实现精细控制。
Kernel Bypass (内核旁路)： 通过专用硬件和驱动绕过操作系统内核协议栈，将网络延迟降到极致（如Solarflare网卡配合OpenOnload/DPDK）。
代码示例：C++高性能发送订单（伪代码）

// 示例：C++高性能发送订单函数（高度简化，用于概念演示）
// 实际生产环境会涉及更复杂的连接池、错误处理、FIX协议编码等

#include 
#include 
#include 
#include  // 用于原子操作

// 模拟预连接的Socket文件描述符（实际会是一个到交易网关的连接）
int g_trading_socket_fd = -1;

// 模拟订单消息结构体，通常是二进制或FIX协议定义
struct OrderMessage {
    char symbol[8]; // 股票代码
    double price;   // 价格
    int quantity;   // 数量
    char side;      // 'B'uy / 'S'ell
    // ... 其他字段，如订单ID，报单类型等
};

// 假设已经有内存池或预分配的缓冲区来避免动态内存分配
// char g_send_buffer[1024];

void init_connection_fast() {
    // 实际：创建Socket，设置非阻塞、TCP_NODELAY等，并连接到交易网关
    g_trading_socket_fd = 123; // 模拟一个有效的fd
    std::cout << "[Exec] 交易连接初始化成功 (伪)。" << std::endl;
}

void send_order_fast(const std::string& symbol, double price, int quantity, char side) {
    if (g_trading_socket_fd == -1) {
        std::cerr << "[Exec] 错误：交易Socket未连接！" << std::endl;
        return;
    }

    OrderMessage msg;
    strncpy(msg.symbol, symbol.c_str(), sizeof(msg.symbol) - 1);
    msg.symbol[sizeof(msg.symbol) - 1] = '\0'; // 确保字符串终止
    msg.price = price;
    msg.quantity = quantity;
    msg.side = side;

    // 1. 高效组装消息（实际可能直接操作预分配的内存块，避免拷贝）
    // memcpy(g_send_buffer, &msg, sizeof(OrderMessage));

    // 2. 通过已连接的Socket发送
    // ssize_t bytes_sent = send(g_trading_socket_fd, g_send_buffer, sizeof(OrderMessage), MSG_DONTWAIT);
    // 这里用cout模拟发送
    std::cout << "[Exec] 发送订单: " << msg.symbol << ", 价格: " << msg.price
              << ", 数量: " << msg.quantity << ", 方向: " << msg.side << std::endl;

    // 实际会检查bytes_sent是否成功
}

// 示例调用：
// init_connection_fast();
// send_order_fast("IBM", 150.25, 200, 'B');

4.3 并发处理与内存优化

为应对海量行情和订单处理，并发模型和内存优化至关重要。

多线程/多进程： 实现任务并行化。
无锁数据结构 (Lock-Free Data Structures)： 如无锁队列、Ring Buffer，通过原子操作（std::atomic等）避免传统互斥锁的开销，提高并发效率。
内存池 (Memory Pool)： 预分配内存，减少系统调用，降低内存碎片。
CPU缓存优化： 内存对齐、避免伪共享，最大化缓存命中率。
代码示例：C++利用原子操作实现无锁计数器

// 示例：C++利用原子操作实现无锁计数器（演示并发安全）
#include 
#include    // 包含原子操作头文件
#include    // 包含线程头文件
#include 

// 定义一个原子计数器，保证在多线程环境下安全地递增
std::atomic<long long> processed_event_count(0);

// 模拟一个高并发事件处理函数
void process_event_concurrently() {
    // 模拟复杂的事件处理逻辑...
    // 每次处理一个事件，原子地增加计数
    processed_event_count.fetch_add(1, std::memory_order_relaxed); // 原子递增操作
    // memory_order_relaxed 是最宽松的内存序，在某些场景下足够，能提供最佳性能
}

int main() {
    std::vector<std::thread> worker_threads;
    int num_threads = 4; // 模拟4个线程并行处理事件
    long long total_events_to_process = 1000000; // 总共要处理100万个事件

    std::cout << "启动 " << num_threads << " 个线程模拟并行处理事件...\n";

    for (int i = 0; i < num_threads; ++i) {
        worker_threads.emplace_back([&] { // 使用lambda表达式创建线程函数
            for (long long j = 0; j < total_events_to_process / num_threads; ++j) {
                process_event_concurrently();
            }
        });
    }

    // 等待所有线程完成
    for (auto& t : worker_threads) {
        t.join();
    }

    // 读取最终的计数器值，保证线程安全
    std::cout << "所有事件处理完毕。总共处理的事件数量: " << processed_event_count.load() << std::endl;

    // 关键点：如果这里使用普通的long long而非atomic，多线程并发读写会导致结果不正确。
    // 原子操作保证了即使在并发环境下，计数也是准确且线程安全的，同时避免了传统互斥锁的开销。
    return 0;
}

5. 风险管理层：量化交易的“安全气囊”

风险管理是量化交易系统的“生命线”，其目标是实时监控风险、快速止损并保障资金安全。

5.1 实时风险指标计算与规则设定

系统需要毫秒级计算账户资金、持仓市值、最大回撤、杠杆率等实时风险指标。
设定多维度风险“红线”：如最大亏损、单品种持仓限额、单笔订单限额等。
技术选型： C++因其极致性能，常用于核心风险指标的实时计算；Python可用于更复杂的风险模型和报告生成。
代码示例：Python实时风控检查（伪代码）

# 示例：Python实时风控检查函数（伪代码）
# 实际生产中，这些检查会在交易路径的关键节点被调用
class RiskManager:
    def __init__(self, initial_capital: float, max_drawdown_ratio: float = 0.05, max_single_pos_limit: int = 10000):
        self.initial_capital = initial_capital
        self.max_drawdown_ratio = max_drawdown_ratio # 最大总回撤比例
        self.max_single_pos_limit = max_single_pos_limit # 单一标的最大持仓量
        self.current_balance = initial_capital
        self.current_positions = {} # {symbol: quantity}

    def update_account_status(self, new_balance: float, new_positions: dict):
        """更新账户余额和持仓信息"""
        self.current_balance = new_balance
        self.current_positions = new_positions
        print(f"\n[RiskMgr] 账户更新：余额 {self.current_balance:.2f}，持仓：{self.current_positions}")

    def check_all_risks(self) -> bool:
        """执行所有风险检查，如果触发风险则返回False"""
        # 1. 检查最大总回撤
        current_drawdown = (self.initial_capital - self.current_balance) / self.initial_capital
        if current_drawdown > self.max_drawdown_ratio:
            print(f" [RiskMgr] 警报！总回撤 {current_drawdown*100:.2f}% 已超限 {self.max_drawdown_ratio*100:.2f}%！")
            self._trigger_emergency_action("总回撤超限") # 触发紧急行动
            return False

        # 2. 检查单一持仓限制
        for symbol, quantity in self.current_positions.items():
            if abs(quantity) > self.max_single_pos_limit:
                print(f" [RiskMgr] 警报！标的 {symbol} 持仓 {quantity} 已超单笔限制 {self.max_single_pos_limit}！")
                self._trigger_emergency_action(f"单笔持仓超限: {symbol}") # 触发紧急行动
                return False

        # 可在此处添加更多风险检查，如：报单频率、资金杠杆率、隔夜仓位等

        print("[RiskMgr] ✔ 风险检查通过。")
        return True

    def _trigger_emergency_action(self, reason: str):
        """触发紧急风控措施（如停止策略、强制平仓等）"""
        print(f" [RiskMgr] 紧急行动触发！原因：{reason}。所有交易可能停止或被强制平仓。")
        # 实际操作会向交易执行层发送指令：
        # self.trading_engine.stop_all_strategies()
        # self.trading_engine.force_close_position(symbol)

# 示例调用
# risk_manager = RiskManager(initial_capital=100000)
# risk_manager.update_account_status(98000, {"AAPL": 500}) # 正常
# risk_manager.check_all_risks()
#
# risk_manager.update_account_status(93000, {"AAPL": 500}) # 模拟触发总回撤
# risk_manager.check_all_risks()
#
# risk_manager.update_account_status(95000, {"GOOG": 12000}) # 模拟触发单笔持仓超限
# risk_manager.check_all_risks()

6. 监控与运维层：系统稳定运行的保障

本层确保量化交易系统稳定、高效、可靠运行，并在出现问题时能快速发现、定位和恢复。

6.1 日志管理系统

详尽的日志是系统调试、故障排查和事后分析的关键。

技术选型： Python的logging模块；配合ELK Stack (Elasticsearch, Logstash, Kibana) 或 Loki + Grafana 实现日志的集中收集、存储、查询和可视化。
代码示例：Python日志记录

# 示例：Python日志记录配置与使用
import logging
import time

# 配置日志记录器
logger = logging.getLogger('QuantSystem') # 获取一个具名的logger实例
logger.setLevel(logging.INFO) # 设置日志级别为INFO，DEBUG级别的信息默认不显示

# 创建一个文件处理器，将日志写入文件
file_handler = logging.FileHandler("quant_system.log")
file_handler.setLevel(logging.INFO)

# 创建一个控制台处理器，将日志输出到标准输出
console_handler = logging.StreamHandler()
console_handler.setLevel(logging.INFO)

# 定义日志输出格式
formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')
file_handler.setFormatter(formatter)
console_handler.setFormatter(formatter)

# 将处理器添加到logger
logger.addHandler(file_handler)
logger.addHandler(console_handler)

# 示例日志输出
logger.info("量化交易引擎启动中...")
time.sleep(0.1)
logger.info("行情订阅服务已连接。")
time.sleep(0.1)
logger.warning("某个策略的信号生成模块运行缓慢，可能需要优化。")
time.sleep(0.1)

try:
    result = 10 / 0 # 模拟一个运行时错误
except Exception as e:
    logger.error("发生严重错误，程序可能崩溃！", exc_info=True) # exc_info=True 会记录完整的堆栈信息
    # 或者使用 logger.exception()，它默认会在ERROR级别记录异常信息和堆栈
    # logger.exception("发生未知异常")

6.2 性能指标监控与可视化

实时监控系统各项关键指标，提供直观的运行状态视图。

技术选型： Prometheus (指标收集和存储)、Grafana (仪表盘可视化)。
代码示例：Python暴露指标给Prometheus（使用prometheus_client）

# 示例：Python暴露自定义指标给Prometheus
# 需要安装：pip install prometheus_client
from prometheus_client import Gauge, Counter, start_http_server
import time
import random

# 定义Gauge指标：可任意设定的数值，用于表示瞬时状态（如账户余额）
ACCOUNT_BALANCE = Gauge('quant_account_balance', 'Current balance of the trading account')
# 定义Counter指标：只增不减的计数器（如处理的总订单数）
PROCESSED_ORDERS_TOTAL = Counter('quant_processed_orders_total', 'Total number of orders processed')
# 定义Gauge指标：用于表示延迟，每次测量设置新值
ORDER_LATENCY_SECONDS = Gauge('quant_order_latency_seconds', 'Latency of order execution in seconds')


def run_metrics_server():
    """启动HTTP服务器，暴露Prometheus可抓取的指标接口"""
    print("Prometheus指标服务器已启动在端口 8000。请配置Prometheus抓取 http://localhost:8000/metrics")
    start_http_server(8000) # 默认在8000端口监听HTTP请求

    # 模拟系统持续运行并更新指标
    while True:
        # 随机更新账户余额
        ACCOUNT_BALANCE.set(random.uniform(95000, 105000))
        # 模拟每次循环处理一个订单
        PROCESSED_ORDERS_TOTAL.inc() # 计数器递增
        # 模拟订单执行延迟
        ORDER_LATENCY_SECONDS.set(random.uniform(0.001, 0.080)) # 1毫秒到80毫秒

        time.sleep(random.uniform(0.5, 2)) # 模拟周期性更新

# 在你的量化系统主程序中启动这个Metrics Server线程
if __name__ == "__main__":
    metrics_thread = threading.Thread(target=run_metrics_server)
    metrics_thread.daemon = True # 设置为守护线程，主程序退出时自动退出
    metrics_thread.start()

    print("主程序继续运行，指标正在后台更新...")
    # 模拟主程序长时间运行
    try:
        while True:
            time.sleep(10)
    except KeyboardInterrupt:
        print("主程序退出。")

6.3 自动化部署与运维 (DevOps)

提高系统部署、更新和维护的效率和可靠性。

容器化 (Docker)： 打包应用及其依赖，确保环境一致性。
容器编排 (Kubernetes)： 自动化部署、扩展和管理容器化应用，构建高可用集群。
持续集成/持续部署 (CI/CD)： Jenkins、GitLab CI/CD、GitHub Actions等，自动化测试、构建和部署流程。

7. 总结与展望

构建一个完整的量化交易系统是一个多学科交叉的复杂工程，涉及数据工程、算法开发、高性能计算、分布式系统、网络编程和风险管理等多个领域。本文从分层的角度，为您解析了量化交易系统的核心技术栈，并提供了相应的代码示例。

从数据采集到策略回测，从高速交易执行到严密风险控制，再到全面的系统监控与自动化运维，每一个环节都至关重要。开发者应根据自身策略的频率、对延迟的要求以及团队规模，合理选择技术栈并进行投入。

量化交易领域仍在快速发展，人工智能、机器学习、硬件加速（FPGA/GPU）等前沿技术正不断融入其中。持续学习和实践，是量化开发者保持竞争力的关键。

资源推荐：

欲深入学习更多量化交易开发相关知识，欢迎访问我的GitHub开源项目：

0voice/Awesome-QuantDev-Learn

这里汇集了从入门到高阶的量化开发资源，期待您的关注和贡献！

你可能感兴趣的:(python,c++,c语言,github,mysql)

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
C++ 计数排序、归并排序、快速排序每天搬一点点砖 c++数据结构算法
计数排序：是一种基于哈希的排序算法。他的基本思想是通过统计每个元素的出现次数，然后根据统计结果将元素依次放入排序后的序列中。这种排序算法适用于范围较小的情况，例如整数范围在0到k之间计数排序步骤：1初始化一个长度为最大元素值加1的计数数组，所有元素初始化为02遍历原始数组，将每个元素值作为索引，在计数数组中对应位置加13将数组清空4遍历计数器数组，按照数组中的元素个数放回到元数组中计数排序的优点和
Git 与 GitHub 的对比与使用指南一念& 其它 git github
Git与GitHub的对比与使用指南在软件开发中，Git和GitHub是两个密切相关但本质不同的工具。下面我将逐步解释它们的定义、区别、核心概念以及如何协同使用，确保内容真实可靠，基于广泛的技术实践。1.什么是Git？Git是一个分布式版本控制系统，由LinusTorvalds于2005年创建。它的核心功能是跟踪代码文件的变化，帮助开发者管理项目历史记录、协作和回滚错误。Git是开源的，可以在本地
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
在线人数统计业务设计（场景八股文）
业务问题在当经的网站中，在线人数的实时统计已经是一个必不可少的模块了，并且该统计功能最好能够按不同的时间间隔做的统计，现在需要你设计一个在线人数统计的模块，你应该怎么进行设计的呢？背景一个网校下会有多个学员。目前平台大概有十个，平台对应的网校大概五十几个，平均一个网校会有5w个用户，预计总人数为200w，最该学员的在线人数在10w左右。设计思路最开始的时候，想到的就是使用mysql直接实现，但是明
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
Effective C++ 条款10：令operator=返回一个reference to *this 君鼎 C++c++
EffectiveC++条款10：令operator=返回一个referenceto*this核心思想：赋值操作符（operator=）应始终返回当前对象的引用（*this），以实现连锁赋值并保持与内置类型一致的语义。⚠️1.问题场景：违反连锁赋值语义classWidget{public:voidoperator=(constWidget&rhs){//错误：返回voidvalue=rhs.val
C++ ：vector的模拟诚自然成 c++开发语言
目录一、vector的迭代器二、vector的构造函数默认构造函数参数构造函数迭代器范围构造函数拷贝构造函数swap:交换vector重载赋值符析构函数reserve:扩容vectorresize:调整大小push_back:添加元素empty:判空pop_back:后删获取大小与容量：size(),capacity()重载operator[]：元素访问insert：插入元素erase:删除一个元
Redis + Caffeine 实现高效的两级缓存架构周童學 Java 缓存 redis 架构
Redis+Caffeine实现高效的两级缓存架构引言在现代高并发系统中，缓存是提升系统性能的关键组件之一。传统的单一缓存方案往往难以同时满足高性能和高可用性的需求。本文将介绍如何结合Redis和Caffeine构建一个高效的两级缓存系统，并通过三个版本的演进展示如何逐步优化代码结构。项目源代码：github地址、gitee地址两级缓存架构概述两级缓存通常由本地缓存（如Caffeine）和分布式缓
mysql复习立夏的李子 mysql 数据库 database
mysqlselect语法selectfromjoinwheregroupbyhavingorderbylimit联合查询innerjoin（）leftjoin（以左表为基准，匹配右表，不匹配的返回左表，右表以null值填充）rightjoind··(去除列重复的数据)索引类型主键索引(PrimaryKey)唯一索引(Unique)常规索引(Index)全文索引(FullText)索引准则索引不是
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
微信公众号回调java_处理微信公众号消息回调 weixin_39607620 微信公众号回调java
1、背景在上一节中，咱们知道如何接入微信公众号，可是以后公众号会与咱们进行交互，那么微信公众号如何通知到咱们本身的服务器呢？咱们知道咱们接入的时候提供的url是GET/mp/entry，那么公众号以后产生的事件将会以POST/mp/entry发送到咱们本身的服务器上。html2、代码实现，此处仍是使用weixin-java-mp这个框架实现一、引入weixin-java-mpcom.github.
C++编程基础与面向对象概念解析侯昂面向对象编程 C++语法函数类与对象继承与多态性
C++编程基础与面向对象概念解析背景简介C++是一种广泛使用的面向对象编程语言，它允许开发者创建高效、灵活且功能强大的程序。本文基于《C++Primer》一书的章节内容，深入解析C++的核心概念和面向对象编程原则，旨在帮助读者构建扎实的C++编程基础。面向对象编程的原则软件危机与进化介绍了软件危机的产生和软件进化的必要性，强调了面向对象编程（OOP）在应对这些问题中的优势。面向对象编程范式讨论了面
手把手教你用C语言实现顺序表
hello，大家好，本篇文章旨在为大家讲解如何使用C语言实现顺序表，还有就是小编自己复习一下相关知识，OK，那我们现在开始。在通讯录中，有增删查改等功能，那么顺序表我们也会对以上功能进行实现。一、创建并初始化顺序表1.创建typedefintSLDataType;#defineINIT_CAPACITY4//动态顺序表--按需申请typedefstructSeqList{SLDataType*a;
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
MySQL复习题
一.填空题1.关系数据库的标准语言是SQL。2.数据库发展的3个阶段中，数据独立性最高的是阶段数据库系统。3.概念模型中的3种基本联系分别是一对一、一对多和多对多。4.MySQL配置文件的文件名是my.ini或my.cnf。5.在MySQL配置文件中，datadir用于指定数据库文件的保存目录。6.添加IFNOTEXISTS可在创建的数据库已存在时防止程序报错。7.MySQL提供的SHOWCREA
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
Pandas：数据科学的超级瑞士军刀科技林总 DeepSeek学AI 人工智能
**——从零基础到高效分析的进化指南**###**一、Pandas诞生：数据革命的救世主****2010年前的数据分析噩梦**：```python#传统Python处理表格数据data=[]forrowincsv_file:ifrow[3]>100androw[2]=="China":data.append(float(row[5])#代码冗长易错！```**核心痛点**：-Excel处理百万行崩
Zread.AI：一键将GitHub项目转化为结构化中文手册的AI代码维基工具
Zread.AI：一键将GitHub项目转化为结构化中文手册的AI代码维基工具文章来源：PoixeAI文章目录Zread.AI工具概述核心功能优势亮点典型应用场景上手指南注意事项官网地址Zread.AI由智谱Z.ai推出，是一款面向开发者的AI代码维基工具，可在几秒内把任何公开GitHub仓库转化为结构化中文手册，并通过独家Buzz面板聚合commits、issues与相关新闻，让项目脉搏一目了然
学C++的五大惊人好处
为什么要学c++学c++有什么用学习c++的好处有1.中考可以加分2.高考可能直接录取3.就业广且工资高4.在未来30--50年c++一定是一个很受欢迎的职业5.c++成功的例子deepsick等AI智能C++语言兼备编程效率和编译运行效率的语言C++语言是C语言功能增强版,在c语言的基础上添加了面向对象编程和泛型编程的支持既继承了C语言高效，简洁，快速和可移植的传统,又具备类似Java、Go等其
Selenium基础教程 lemontree1945 selenium python 测试工具
1.Selenium环境安装1.1浏览器安装Chrome和ChromeDriver下载地址:https://googlechromelabs.github.io/chrome-for-testing/注意：驱动版本号要和浏览器版本号一致；安装后关闭浏览器自动更新:services.msc:打开系统服务找到和google相关的服务，全部修改为禁用1.2安装第三方库seleniumpipinstall
【Jupyter】个人开发常见命令 TIM老师 #Pycharm &VSCode python Jupyter
1.查看python版本importsysprint(sys.version)2.ipynb/py文件转换jupyternbconvert--topythonmy_file.ipynbipynb转换为mdjupyternbconvert--tomdmy_file.ipynbipynb转为htmljupyternbconvert--tohtmlmy_file.ipynbipython转换为pdfju
用 Python 开发小游戏：零基础也能做出《贪吃蛇》
本文专为零基础学习者打造，详细介绍如何用Python开发经典小游戏《贪吃蛇》。无需复杂编程知识，从环境搭建到代码编写、功能实现，逐步讲解核心逻辑与操作。涵盖Pygame库的基础运用、游戏界面设计、蛇的移动与食物生成规则等，让新手能按步骤完成开发，同时融入SEO优化要点，帮助读者轻松入门Python游戏开发，体验从0到1做出游戏的乐趣。一、为什么选择用Python开发《贪吃蛇》对于零基础学习者来说，
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
lesson20：Python函数的标注你的电影很有趣 python 开发语言
目录引言：为什么函数标注是现代Python开发的必备技能一、函数标注的基础语法1.1参数与返回值标注1.2支持的标注类型1.3Python3.9+的重大改进：标准集合泛型二、高级标注技巧与最佳实践2.1复杂参数结构标注2.2函数类型与回调标注2.3变量注解与类型别名三、静态类型检查工具应用3.1mypy：最流行的类型检查器3.2Pyright与IDE集成3.3运行时类型验证四、函数标注的工程价值与
你的连接不是专用连接攻击者可能试图从 github.com 窃取你的信息(例如，密码、消息或信用卡)。 --解决办法
我遇到了.检查安全软件或企业防火墙/代理(包括VPN)这个问题，关了就好，我是用来xbox加速github，所以先开在关既可以加速又可以访问这个错误表明你的浏览器（MicrosoftEdge）无法安全地连接到GitHub，因为遇到了证书验证问题（NET::ERR_CERT_AUTHORITY_INVALID）。错误信息明确指出网站使用了HSTS（HTTPStrictTransportSecurit
Jupyter Notebook：数据科学的“瑞士军刀” a小胡哦机器学习基础人工智能机器学习
在数据科学的世界里，JupyterNotebook是一个不可或缺的工具，它就像是数据科学家手中的“瑞士军刀”，功能强大且灵活多变。今天，就让我们一起深入了解这个神奇的工具。一、JupyterNotebook是什么？JupyterNotebook是一个开源的Web应用程序，它允许你创建和共享包含实时代码、方程、可视化和解释性文本的文档。它支持多种编程语言，其中Python是最常用的语言之一。Jupy
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 [email protected] 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源