量化价值投资入门到精通

Scikit-learn：开启量化价值投资的新征程

关键词：Scikit-learn、量化投资、价值投资、机器学习、特征工程、投资组合优化、金融数据分析

摘要：本文深入探讨了如何利用Scikit-learn这一强大的Python机器学习库来构建量化价值投资系统。文章从基础概念出发，详细介绍了价值投资的量化实现方法，包括数据获取与处理、特征工程、模型构建与优化等关键环节。通过实际案例展示了如何使用机器学习算法筛选优质股票、构建投资组合，并对未来发展趋势进行了展望。本文旨在为金融从业者和数据科学家提供一个实用的技术指南，帮助他们在量化投资领域实现更科学、更高效的决策。

1. 背景介绍

1.1 目的和范围

本文旨在探讨如何将Scikit-learn这一强大的机器学习工具包应用于量化价值投资领域。我们将从基础概念出发，逐步深入到实际应用，涵盖数据获取、特征工程、模型构建、回测验证等完整流程。本文不仅介绍技术实现，还将探讨量化价值投资的核心理念和最佳实践。

1.2 预期读者

本文适合以下几类读者：

金融从业者希望了解机器学习在投资领域的应用
数据科学家/分析师寻求将技能应用于金融领域
量化投资研究人员寻找实用的技术解决方案
对价值投资和机器学习交叉领域感兴趣的学者和学生

1.3 文档结构概述

本文首先介绍量化价值投资的基本概念，然后详细讲解如何使用Scikit-learn实现各个关键环节。接着通过实际案例展示完整实现流程，最后讨论应用场景、工具资源和未来趋势。文章结构设计为从理论到实践，循序渐进地引导读者掌握相关技术。

1.4 术语表

1.4.1 核心术语定义

量化价值投资：结合定量分析和价值投资理念的投资方法
特征工程：将原始数据转换为更能反映问题本质的特征的过程
回测：使用历史数据测试投资策略表现的方法
阿尔法：投资组合超越基准的超额收益
夏普比率：衡量风险调整后收益的指标

1.4.2 相关概念解释

F-score：衡量公司财务健康状况的指标
动量效应：资产价格延续之前趋势的现象
均值回归：价格最终会回归长期平均水平的理论
因子模型：解释资产收益的多因素统计模型

1.4.3 缩略词列表

ML：机器学习(Machine Learning)
API：应用程序接口(Application Programming Interface)
ETL：提取、转换、加载(Extract, Transform, Load)
ROC：接收者操作特征曲线(Receiver Operating Characteristic)
AUC：曲线下面积(Area Under Curve)

2. 核心概念与联系

量化价值投资结合了传统价值投资理念与现代数据分析技术，其核心是通过系统化的方法识别被市场低估的优质资产。Scikit-learn在这一过程中扮演着关键角色，提供了从数据预处理到模型构建的全套工具。

金融数据源

数据清洗

特征工程

模型训练

投资组合构建

回测验证

实盘部署

持续优化

上图展示了量化价值投资的典型流程。Scikit-learn主要应用于特征工程和模型训练环节，但其预处理和评估模块在整个流程中都发挥着重要作用。

价值投资的量化实现需要关注以下几个关键方面：

财务指标量化：将传统的价值投资指标如P/E、P/B、ROE等转化为可计算的数值特征
质量评估：使用机器学习模型评估公司的财务健康状况和竞争优势
估值模型：构建预测未来收益的统计模型
组合优化：在风险约束下最大化预期收益

Scikit-learn的各类算法可以很好地支持这些需求：

线性模型用于因子分析和收益预测
集成方法用于提高预测稳定性
无监督学习用于市场状态识别和异常检测
模型评估工具用于策略验证

3. 核心算法原理 & 具体操作步骤

3.1 数据准备与特征工程

量化价值投资的第一步是获取和准备数据。我们需要收集以下几类数据：

公司基本面数据（财务报表等）
市场交易数据（价格、成交量等）
宏观经济数据（利率、GDP等）
另类数据（新闻情绪、供应链信息等）

以下是一个使用Python获取和处理金融数据的示例：

import pandas as pd
import numpy as np
from sklearn.preprocessing import StandardScaler, FunctionTransformer
from sklearn.pipeline import Pipeline
from sklearn.compose import ColumnTransformer

# 示例：财务数据特征工程
def calculate_financial_ratios(X):
    """计算常用财务比率"""
    ratios = pd.DataFrame()
    ratios['P/E'] = X['price'] / X['eps']
    ratios['P/B'] = X['price'] / X['book_value']
    ratios['ROE'] = X['net_income'] / X['shareholder_equity']
    ratios['Current_Ratio'] = X['current_assets'] / X['current_liabilities']
    return ratios

# 创建特征工程管道
financial_transformer = Pipeline([
    ('calculate_ratios', FunctionTransformer(calculate_financial_ratios)),
    ('scaler', StandardScaler())
])

# 组合多个特征处理器
preprocessor = ColumnTransformer([
    ('financial', financial_transformer, ['price', 'eps', 'book_value', 
                                         'net_income', 'shareholder_equity',
                                         'current_assets', 'current_liabilities']),
    ('technical', StandardScaler(), ['ma_50', 'ma_200', 'rsi_14'])
])

# 使用示例
sample_data = pd.DataFrame({
    'price': [100, 150, 80],
    'eps': [5, 7.5, 4],
    # 其他字段...
})
processed_data = preprocessor.fit_transform(sample_data)

3.2 价值投资信号构建

传统价值投资关注以下几个维度，我们可以用Scikit-learn将其量化：

估值信号：识别相对于内在价值被低估的股票
质量信号：评估公司的财务健康状况和竞争优势
动量信号：捕捉价格趋势的持续性或反转

以下是构建复合价值信号的示例：

from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split

# 假设我们已经准备好了特征矩阵X和目标变量y（未来超额收益）
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 构建随机森林模型
value_model = RandomForestClassifier(
    n_estimators=100,
    max_depth=5,
    min_samples_leaf=10,
    random_state=42
)

# 训练模型
value_model.fit(X_train, y_train)

# 评估模型
train_score = value_model.score(X_train, y_train)
test_score = value_model.score(X_test, y_test)
print(f"Train Accuracy: {train_score:.2f}, Test Accuracy: {test_score:.2f}")

3.3 投资组合优化

获得股票评分后，我们需要将其转化为实际的投资组合。这可以通过Scikit-learn与优化库结合实现：

from scipy.optimize import minimize

def portfolio_optimization(scores, cov_matrix, risk_aversion=1.0):
    """基于评分和风险矩阵的投资组合优化"""
    n_assets = len(scores)
    initial_weights = np.ones(n_assets) / n_assets
    
    # 定义优化目标函数
    def objective(weights):
        portfolio_score = np.dot(weights, scores)
        portfolio_variance = np.dot(weights.T, np.dot(cov_matrix, weights))
        return -(portfolio_score - risk_aversion * portfolio_variance)
    
    # 约束条件
    constraints = ({'type': 'eq', 'fun': lambda x: np.sum(x) - 1})
    bounds = [(0, 0.1) for _ in range(n_assets)]  # 单资产上限10%
    
    # 优化求解
    result = minimize(
        objective,
        initial_weights,
        method='SLSQP',
        bounds=bounds,
        constraints=constraints
    )
    
    return result.x

# 示例使用
scores = value_model.predict_proba(X_test)[:, 1]  # 获取正面概率作为评分
cov_matrix = X_test.cov()  # 简化的协方差矩阵
optimal_weights = portfolio_optimization(scores, cov_matrix)

4. 数学模型和公式 & 详细讲解 & 举例说明

4.1 价值投资因子模型

量化价值投资通常采用多因子模型来解释股票收益。最基本的线性因子模型可以表示为：

$r_i = \alpha_i + \sum_{j=1}^{k} \beta_{ij} f_j + \epsilon_i$

其中：

$r_i$ 是股票i的超额收益
$\alpha_i$ 是股票i的特异性收益（阿尔法）
$\beta_{ij}$ 是股票i对因子j的暴露度
$f_j$ 是因子j的收益率
$\epsilon_i$ 是误差项

在Scikit-learn中，这可以转化为一个线性回归问题：

from sklearn.linear_model import LinearRegression

# 假设factors是因子暴露矩阵，returns是股票收益
model = LinearRegression()
model.fit(factors, returns)

# 获取因子收益估计
factor_returns = model.coef_

4.2 风险模型

投资组合风险通常用方差衡量：

$\sigma_p^2 = \mathbf{w}^T \Sigma \mathbf{w}$

其中：

$\sigma_p^2$ 是组合方差
$\mathbf{w}$ 是权重向量
$\Sigma$ 是协方差矩阵

协方差矩阵的估计可以通过历史收益计算，也可以使用更复杂的统计模型。Scikit-learn的EmpiricalCovariance和LedoitWolf估计器可以用于此目的：

from sklearn.covariance import LedoitWolf

# 使用Ledoit-Wolf收缩估计器改进协方差矩阵估计
lw = LedoitWolf()
lw.fit(historical_returns)
cov_matrix = lw.covariance_

4.3 组合优化目标

现代投资组合理论的目标函数可以表示为：

$\max_{\mathbf{w}} \mathbf{w}^T \mathbf{\mu} - \frac{\gamma}{2} \mathbf{w}^T \Sigma \mathbf{w}$

约束条件：
$\mathbf{1}^T \mathbf{w} = 1 \\ \mathbf{w} \geq 0$

其中：

$\mathbf{\mu}$ 是预期收益向量
$\gamma$ 是风险厌恶系数

这个优化问题可以使用Scipy的优化工具求解，如前文示例所示。

5. 项目实战：代码实际案例和详细解释说明

5.1 开发环境搭建

建议使用以下环境进行量化价值投资开发：

Python 3.8+
主要库：
- Scikit-learn
- Pandas
- NumPy
- Matplotlib/Seaborn
- yfinance（雅虎财经数据）
- backtrader（回测引擎）

可以使用conda或pip安装：

conda create -n quant python=3.8
conda activate quant
pip install scikit-learn pandas numpy matplotlib seaborn yfinance backtrader

5.2 源代码详细实现和代码解读

以下是一个完整的量化价值投资策略实现示例：

import pandas as pd
import numpy as np
import yfinance as yf
from sklearn.ensemble import GradientBoostingClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler

def download_data(tickers, start_date, end_date):
    """下载财务和价格数据"""
    data = {}
    for ticker in tickers:
        stock = yf.Ticker(ticker)
        # 获取价格数据
        prices = stock.history(start=start_date, end=end_date)['Close']
        # 获取基本面数据（简化版）
        info = stock.info
        data[ticker] = {
            'price': prices[-1],
            'pe': info.get('trailingPE', np.nan),
            'pb': info.get('priceToBook', np.nan),
            'debt_to_equity': info.get('debtToEquity', np.nan),
            'return_on_equity': info.get('returnOnEquity', np.nan),
            '52_week_high': info.get('fiftyTwoWeekHigh', np.nan),
            '52_week_low': info.get('fiftyTwoWeekLow', np.nan)
        }
    return pd.DataFrame.from_dict(data, orient='index')

def calculate_features(df):
    """计算特征"""
    features = df.copy()
    # 估值指标
    features['distance_to_high'] = (features['52_week_high'] - features['price']) / features['52_week_high']
    features['distance_to_low'] = (features['price'] - features['52_week_low']) / features['52_week_low']
    # 质量指标
    features['profitability'] = features['return_on_equity'] * (1 - features['debt_to_equity'])
    return features[['pe', 'pb', 'distance_to_high', 'distance_to_low', 'profitability']]

def prepare_targets(prices, horizon=90):
    """准备目标变量：未来90天是否跑赢市场"""
    returns = prices.pct_change(horizon).shift(-horizon)
    market_return = returns.mean(axis=1)
    target = (returns > market_return).astype(int)
    return target.dropna()

# 主程序
if __name__ == "__main__":
    # 获取标普500成分股
    sp500 = pd.read_html('https://en.wikipedia.org/wiki/List_of_S%26P_500_companies')[0]
    tickers = sp500['Symbol'].tolist()[:100]  # 取前100只股票作示例
    
    # 下载数据
    start_date = '2020-01-01'
    end_date = '2023-01-01'
    data = download_data(tickers, start_date, end_date)
    
    # 准备特征和目标
    features = calculate_features(data)
    prices = pd.DataFrame({ticker: yf.Ticker(ticker).history(start=start_date, end=end_date)['Close'] 
                          for ticker in tickers})
    target = prepare_targets(prices)
    
    # 对齐数据
    common_index = features.index.intersection(target.index)
    X = features.loc[common_index]
    y = target.loc[common_index]
    
    # 划分训练测试集
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
    
    # 构建模型管道
    model = Pipeline([
        ('scaler', StandardScaler()),
        ('classifier', GradientBoostingClassifier(
            n_estimators=100,
            learning_rate=0.1,
            max_depth=3,
            random_state=42
        ))
    ])
    
    # 训练模型
    model.fit(X_train, y_train)
    
    # 评估模型
    print("Train Score:", model.score(X_train, y_train))
    print("Test Score:", model.score(X_test, y_test))
    print(classification_report(y_test, model.predict(X_test)))
    
    # 获取特征重要性
    importance = pd.DataFrame({
        'feature': X.columns,
        'importance': model.named_steps['classifier'].feature_importances_
    }).sort_values('importance', ascending=False)
    print("\nFeature Importance:")
    print(importance)

5.3 代码解读与分析

上述代码实现了一个完整的量化价值投资流程：

数据获取：从雅虎财经下载股票价格和基本面数据
特征工程：计算估值指标（P/E、P/B）、价格位置指标（52周高低点距离）和质量指标（盈利能力）
目标定义：以股票未来90天是否跑赢市场作为分类目标
模型构建：使用梯度提升树（GBDT）进行分类预测
评估分析：输出模型表现和特征重要性

关键点分析：

特征设计：结合了传统价值指标和现代量化技术
目标定义：将连续收益预测转化为分类问题，简化了建模难度
模型选择：GBDT能够自动处理非线性关系和特征交互
评估指标：除了准确率，还应关注策略的夏普比率、最大回撤等金融指标

6. 实际应用场景

Scikit-learn在量化价值投资中的应用场景广泛，主要包括：

股票筛选：
- 构建财务健康评分模型
- 识别被低估的优质公司
- 检测财务造假风险
因子研究：
- 发现新的阿尔法因子
- 测试因子组合的有效性
- 优化因子权重
组合管理：
- 动态资产配置
- 风险模型构建
- 交易成本优化
市场状态识别：
- 使用聚类算法识别不同市场环境
- 根据市场状态调整策略参数
- 检测市场异常和极端事件

实际案例：一家中型对冲基金使用Scikit-learn构建的价值增强策略，在保持价值投资核心理念的同时，通过机器学习优化选股流程，使策略的年化收益从12%提升到15%，同时最大回撤从25%降低到18%。

7. 工具和资源推荐

7.1 学习资源推荐

7.1.1 书籍推荐

《主动投资组合管理》- Richard Grinold & Ronald Kahn
《量化价值投资》- Wesley Gray & Tobias Carlisle
《机器学习在金融中的应用》- Jannes Klaas
《Python金融大数据分析》- Yves Hilpisch

7.1.2 在线课程

Coursera: “Machine Learning for Trading” - Georgia Tech
Udemy: “Python for Financial Analysis and Algorithmic Trading”
QuantInsti: “Algorithmic Trading & Quantitative Analysis”
EDX: “Data Science for Finance” - NYU

7.1.3 技术博客和网站

QuantInsti Blog
QuantConnect Blog
Towards Data Science - Finance Section
Kaggle金融数据集和竞赛

7.2 开发工具框架推荐

7.2.1 IDE和编辑器

Jupyter Notebook/Lab - 交互式数据分析
VS Code - 轻量级代码编辑器
PyCharm - 专业Python IDE
Spyder - 科学计算环境

7.2.2 调试和性能分析工具

Python Profiler (cProfile)
memory_profiler
line_profiler
Py-Spy - 采样分析器

7.2.3 相关框架和库

Zipline - 回测框架
Backtrader - 多功能回测引擎
PyPortfolioOpt - 组合优化
Riskfolio-Lib - 高级风险管理

7.3 相关论文著作推荐

7.3.1 经典论文

“The Cross-Section of Expected Stock Returns” - Fama & French (1992)
“Value Investing: The Use of Historical Financial Statement Information” - Piotroski (2000)
“Machine Learning in Finance: The Case of Deep Learning for Option Pricing” - Ruf & Wang (2020)

7.3.2 最新研究成果

“Deep Learning for Portfolio Optimization” - Zhang et al. (2022)
“Enhancing Value Investing with Machine Learning” - Gu et al. (2023)
“Interpretable Machine Learning for Factor Investing” - Chen & Zimmermann (2021)

7.3.3 应用案例分析

“AQR Case Study: Machine Learning in Factor Investing”
“BlackRock’s Aladdin: Integrating AI into Portfolio Management”
“Man Group’s Machine Learning Applications in Quantitative Investing”

8. 总结：未来发展趋势与挑战

量化价值投资领域正在经历由机器学习驱动的深刻变革，未来发展趋势包括：

多模态数据融合：结合文本、图像等非结构化数据增强传统量化模型
可解释AI：开发能够解释投资决策的透明模型，满足合规要求
实时学习系统：适应市场变化的在线学习算法
强化学习应用：将组合管理建模为序贯决策问题
另类数据挖掘：从卫星图像、社交媒体等新数据源提取阿尔法

面临的挑战：

数据质量：金融数据的噪声和非平稳性问题
过拟合风险：在有限数据上构建复杂模型的风险
市场变化：因子失效和策略衰减的速度加快
监管合规：AI决策的透明度和可解释性要求
实施成本：高质量数据和计算资源的获取成本

Scikit-learn作为成熟的机器学习库，虽然不专门为金融设计，但其丰富的算法和易用性使其成为量化价值投资的理想工具。未来随着生态系统的完善，我们可能会看到更多针对金融场景优化的Scikit-learn扩展库出现。

9. 附录：常见问题与解答

Q1：价值投资可以完全量化吗？

A1：虽然核心价值理念可以量化实现，但完全自动化仍有挑战。最佳实践是结合定量模型与定性分析，使用模型筛选标的，人工进行最终决策。

Q2：需要多少数据才能构建有效的量化价值模型？

A2：建议至少10年历史数据，覆盖完整市场周期。对于美股，300-500只股票的数据可以提供足够样本。质量比数量更重要。

Q3：如何避免量化价值策略的过拟合？

A3：(1)保持模型简单 (2)使用严格的样本外测试 (3)应用交叉验证 (4)限制参数数量 (5)检查策略经济逻辑合理性

Q4：Scikit-learn和TensorFlow/PyTorch在量化投资中如何选择？

A4：Scikit-learn适合传统因子模型和结构化数据分析，TensorFlow/PyTorch更适合处理非结构化数据或开发端到端深度学习系统。多数价值投资问题用Scikit-learn足够。

Q5：回测表现良好但实盘不佳的常见原因？

A5：(1)忽略交易成本 (2)幸存者偏差 (3)数据窥探 (4)市场结构变化 (5)流动性假设不现实。建议使用保守假设并进行前瞻性测试。

10. 扩展阅读 & 参考资料

Scikit-learn官方文档：https://scikit-learn.org
价值投资研究基金会：https://www.valueinvesting.org
QuantConnect教程：https://www.quantconnect.com/learn
Kaggle金融数据集：https://www.kaggle.com/datasets?tags=13204-finance
金融机器学习开源项目：https://github.com/topics/financial-machine-learning

通过本文的系统介绍，我们展示了Scikit-learn在量化价值投资中的强大应用潜力。从数据准备到模型构建，再到组合优化，Scikit-learn提供了完整的工具链。随着技术的不断发展，机器学习将为价值投资这一传统领域注入新的活力，开启量化分析的新征程。

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
英伟达靠什么支撑起了4万亿？AI泡沫还能撑多久？
英伟达市值突破4万亿美元，既是AI算力需求爆发的直接体现，也暗含市场对未来的狂热预期。其支撑逻辑与潜在风险并存，而AI泡沫的可持续性则取决于技术、商业与地缘政治的复杂博弈。⚙️一、英伟达4万亿市值的核心支撑因素技术垄断与生态壁垒硬件优势：英伟达GPU在AI训练市场占有率超87%，H100芯片的FP16算力达1979TFLOPS，领先竞品3-5倍。CUDA生态：400万开发者构建的软件护城河，成为A
Spring进阶 - SpringMVC实现原理之DispatcherServlet处理请求的过程倾听铃的声后端 spring java mvc 开发语言分布式
前文我们有了IOC的源码基础以及SpringMVC的基础，我们便可以进一步深入理解SpringMVC主要实现原理，包含DispatcherServlet的初始化过程和DispatcherServlet处理请求的过程的源码解析。本文是第二篇：DispatcherServlet处理请求的过程的源码解析。@pdaiSpring进阶-SpringMVC实现原理之DispatcherServlet处理请求的
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
企业级区块链平台Hyperchain核心原理剖析 boyedu 区块链区块链企业级区块链平台 Hyperchain
Hyperchain作为国产自主可控的企业级联盟区块链平台，其核心原理围绕高性能共识、隐私保护、智能合约引擎及可扩展架构展开，通过多模块协同实现企业级区块链网络的高效部署与安全运行。以下从核心架构、关键技术、性能优化、安全机制、应用场景五个维度展开剖析：一、核心架构：分层解耦与模块化设计Hyperchain采用分层架构，将区块链功能解耦为独立模块，支持灵活组合与扩展：P2P网络层由验证节点（VP）
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
2025年SDK游戏盾终极解析：重新定义手游安全的“隐形护甲” 上海云盾商务经理杨杨游戏安全
副标题：从客户端加密到AI反外挂，拆解全链路防护如何重塑游戏攻防天平引言：当传统高防在手游战场“失效”2025年全球手游市场规模突破$2000亿，黑客单次攻击成本却降至$30——某SLG游戏因协议层CC攻击单日流失37%玩家，某开放世界游戏遭低频DDoS瘫痪6小时损失千万。传统高防IP的致命短板暴露无遗：无法识别伪造客户端流量、难防协议篡改、误杀率超15%。而集成于游戏终端的SDK游戏盾，正以“源
LVS+Keepalived实现高可用和负载均衡 2401_84412895 程序员 lvs 负载均衡运维
2、开启网卡子接口配置VIP[root@a~]#cd/etc/sysconfig/network-scripts/[root@anetwork-scripts]#cp-aifcfg-ens32ifcfg-ens32:0[root@anetwork-scripts]#catifcfg-ens32:0BOOTPROTO=staticDEVICE=ens32:0ONBOOT=yesIPADDR=10.1
CodeFoeces-450B ss5smi
题目原题链接：B.JzzhuandSequences题意根据公式公式计算对应fn的值。参考了其他作者的代码和思路。找循环点。负数取余需要加取余数到>0为止才可取余。代码#includeusingnamespacestd;constintmod=1e9+7;intmain(){longlongf[10],x,y,n;cin>>x>>y>>n;x=(x+mod)%mod;y=(y+mod)%mod;f
【异常】使用 LiteFlow 框架时，提示错误ChainDuplicateException: [chain name duplicate] chainName=categoryChallenge 本本本添哥 002 -进阶开发能力 java
一、报错内容Causedby:com.yomahub.liteflow.exception.ChainDuplicateException:[chainnameduplicate]chainName=categoryChallengeatcom.yomahub.liteflow.parser.helper.ParserHelper.lambda$null$0(ParserHelper.java:1
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
AI模型训练中过拟合和欠拟合的区别是什么？ workflower 人工智能算法人工智能数据分析
在AI模型训练中，过拟合和欠拟合是两种常见的模型性能问题，核心区别在于模型对数据的学习程度和泛化能力：欠拟合（Underfitting）-定义：模型未能充分学习到数据中的规律，对训练数据的拟合程度较差，在训练集和测试集上的表现都不好（如准确率低、损失值高）。-原因：-模型结构过于简单（如用线性模型解决非线性问题）；-训练数据量不足或特征信息不充分；-训练时间太短，模型尚未学到有效模式。-表现：训练
Selenium 特殊控件操作与 ActionChains 实践详解小馋喵知识杂货铺 selenium 测试工具
1.下拉框单选操作(a)使用SeleniumSelect类（标准HTML标签）Selenium提供了内置的Select类用于操作标准下拉框，这种方式简单且直观。fromselenium.webdriver.support.uiimportSelect#定位下拉框dropdown=Select(driver.find_element("id","dropdown_id"))#通过以下三种方式选择单个
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
Pandas：数据科学的超级瑞士军刀科技林总 DeepSeek学AI 人工智能
**——从零基础到高效分析的进化指南**###**一、Pandas诞生：数据革命的救世主****2010年前的数据分析噩梦**：```python#传统Python处理表格数据data=[]forrowincsv_file:ifrow[3]>100androw[2]=="China":data.append(float(row[5])#代码冗长易错！```**核心痛点**：-Excel处理百万行崩
Zread.AI：一键将GitHub项目转化为结构化中文手册的AI代码维基工具
Zread.AI：一键将GitHub项目转化为结构化中文手册的AI代码维基工具文章来源：PoixeAI文章目录Zread.AI工具概述核心功能优势亮点典型应用场景上手指南注意事项官网地址Zread.AI由智谱Z.ai推出，是一款面向开发者的AI代码维基工具，可在几秒内把任何公开GitHub仓库转化为结构化中文手册，并通过独家Buzz面板聚合commits、issues与相关新闻，让项目脉搏一目了然
学C++的五大惊人好处
为什么要学c++学c++有什么用学习c++的好处有1.中考可以加分2.高考可能直接录取3.就业广且工资高4.在未来30--50年c++一定是一个很受欢迎的职业5.c++成功的例子deepsick等AI智能C++语言兼备编程效率和编译运行效率的语言C++语言是C语言功能增强版,在c语言的基础上添加了面向对象编程和泛型编程的支持既继承了C语言高效，简洁，快速和可移植的传统,又具备类似Java、Go等其
机器学习必备数学与编程指南：从入门到精通 a小胡哦机器学习基础机器学习人工智能
一、机器学习核心数学基础1.线性代数（神经网络的基础）必须掌握：矩阵运算（乘法、转置、逆）向量空间与线性变换特征值分解与奇异值分解(SVD)为什么重要：神经网络本质就是矩阵运算学习技巧：用NumPy实际操作矩阵运算2.概率与统计（模型评估的关键）核心概念：条件概率与贝叶斯定理概率分布（正态、泊松、伯努利）假设检验与p值应用场景：朴素贝叶斯、A/B测试3.微积分（优化算法的基础）重点掌握：导数与偏导
Android GreenDao介绍和Generator生成表对象代码
目录(?)[-]介绍创建工程转载请注明：http://blog.csdn.net/sinat_30276961/article/details/50052109最近无意中发现了GreenDao，然后查看了一些资料后，发现这个数据库框架很适合用，于是乎，查看了官网的api，并自己写了一个小应用总结一下它的使用方法。介绍按照国际惯例，在开篇，总要先介绍一下什么是GreenDao吧。首先需要说明的是Gr
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践 Liudef06小白特殊专栏人工智能 AIGC 架构人工智能 deepseek
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践DeepSeek大模型正重塑游戏开发范式，本文将深入解析如何利用这一革命性技术构建下一代大型游戏，涵盖从架构设计到项目管理的全流程实践。目录DeepSeek游戏引擎核心架构1.1神经符号系统融合架构1.2动态世界生成引擎智能NPC与剧情系统2.1角色人格建模技术2.2动态叙事生成算法大型项目管理体系3.1敏捷-AI混合开发流
魔搭平台实战：手把手教你训练SDXL模型，解锁AI绘画新纪元 Liudef06小白特殊专栏 AIGC 人工智能 AI作画人工智能 AIGC
魔搭平台实战：手把手教你训练SDXL模型，解锁AI绘画新纪元随着多模态AI技术的爆发式发展，StableDiffusionXL（SDXL）等文生图模型正在彻底重塑创意产业工作流。本文将深入解析如何在魔搭平台高效训练SDXL模型，并探讨AI绘画技术对设计行业的革命性影响。一、SDXL模型架构解析1.1双文本编码器设计SDXL采用双文本编码器架构，显著提升提示词理解能力：#SDXL文本编码器结构示意c
【Jupyter】个人开发常见命令 TIM老师 #Pycharm &VSCode python Jupyter
1.查看python版本importsysprint(sys.version)2.ipynb/py文件转换jupyternbconvert--topythonmy_file.ipynbipynb转换为mdjupyternbconvert--tomdmy_file.ipynbipynb转为htmljupyternbconvert--tohtmlmy_file.ipynbipython转换为pdfju
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
用 Python 开发小游戏：零基础也能做出《贪吃蛇》
本文专为零基础学习者打造，详细介绍如何用Python开发经典小游戏《贪吃蛇》。无需复杂编程知识，从环境搭建到代码编写、功能实现，逐步讲解核心逻辑与操作。涵盖Pygame库的基础运用、游戏界面设计、蛇的移动与食物生成规则等，让新手能按步骤完成开发，同时融入SEO优化要点，帮助读者轻松入门Python游戏开发，体验从0到1做出游戏的乐趣。一、为什么选择用Python开发《贪吃蛇》对于零基础学习者来说，
sql统计相同项个数并按名次显示朱辉辉33 java oracle
现在有如下这样一个表： A表 ID Name time ------------------------------ 0001 aaa 2006-11-18 0002 ccc 2006-11-18 0003 eee 2006-11-18 0004 aaa 2006-11-18 0005 eee 2006-11-18 0004 aaa 2006-11-18 0002 ccc 20
Android+Jquery Mobile学习系列-目录白糖_ JQuery Mobile
最近在研究学习基于Android的移动应用开发，准备给家里人做一个应用程序用用。向公司手机移动团队咨询了下，觉得使用Android的WebView上手最快，因为WebView等于是一个内置浏览器，可以基于html页面开发，不用去学习Android自带的七七八八的控件。然后加上Jquery mobile的样式渲染和事件等，就能非常方便的做动态应用了。从现在起，往后一段时间，我打算
如何给线程池命名 daysinsun 线程池
在系统运行后，在线程快照里总是看到线程池的名字为pool-xx，这样导致很不好定位，怎么给线程池一个有意义的名字呢。参照ThreadPoolExecutor类的ThreadFactory，自己实现ThreadFactory接口，重写newThread方法即可。参考代码如下： public class Named
IE 中"HTML Parsing Error:Unable to modify the parent container element before the 周凡杨 html 解析 error readyState
错误： IE 中"HTML Parsing Error:Unable to modify the parent container element before the child element is closed" 现象：同事之间几个IE 测试情况下，有的报这个错，有的不报。经查询资料后，可归纳以下原因。
java上传 g21121 java
我们在做web项目中通常会遇到上传文件的情况，用struts等框架的会直接用的自带的标签和组件，今天说的是利用servlet来完成上传。我们这里利用到commons-fileupload组件，相关jar包可以取apache官网下载：http://commons.apache.org/ 下面是servlet的代码： //定义一个磁盘文件工厂 DiskFileItemFactory fact
SpringMVC配置学习 510888780 spring mvc
spring MVC配置详解现在主流的Web MVC框架除了Struts这个主力外，其次就是Spring MVC了，因此这也是作为一名程序员需要掌握的主流框架，框架选择多了，应对多变的需求和业务时，可实行的方案自然就多了。不过要想灵活运用Spring MVC来应对大多数的Web开发，就必须要掌握它的配置及原理。　　一、Spring MVC环境搭建：（Spring 2.5.6 + Hi
spring mvc-jfreeChart 柱图(1) 布衣凌宇 jfreechart
第一步：下载jfreeChart包，注意是jfreeChart文件lib目录下的，jcommon-1.0.23.jar和jfreechart-1.0.19.jar两个包即可；第二步：配置web.xml; web.xml代码如下 <servlet> <servlet-name>jfreechart</servlet-nam
我的spring学习笔记13-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java P
java 线程池使用 Runnable&Callable&Future antlove java thread Runnable callable future
1. 创建线程池 ExecutorService executorService = Executors.newCachedThreadPool(); 2. 执行一次线程，调用Runnable接口实现 Future<?> future = executorService.submit(new DefaultRunnable()); System.out.prin
XML语法元素结构的总结百合不是茶 xml 树结构
1.XML介绍1969年 gml (主要目的是要在不同的机器进行通信的数据规范)1985年 sgml standard generralized markup language1993年 html(www网)1998年 xml extensible markup language
改变eclipse编码格式 bijian1013 eclipse 编码格式
1.改变整个工作空间的编码格式改变整个工作空间的编码格式，这样以后新建的文件也是新设置的编码格式。 Eclipse->window->preferences->General->workspace-
javascript中return的设计缺陷 bijian1013 JavaScript AngularJS
代码1： <script> var gisService = (function(window) { return { name:function () { alert(1); } }; })(this); gisService.name(); &l
【持久化框架MyBatis3八】Spring集成MyBatis3 bit1129 Mybatis3
pom.xml配置 Maven的pom中主要包括： MyBatis MyBatis-Spring Spring MySQL-Connector-Java Druid applicationContext.xml配置 <?xml version="1.0" encoding="UTF-8"?> &
java web项目启动时自动加载自定义properties文件 bitray java Web 监听器相对路径
创建一个类 public class ContextInitListener implements ServletContextListener 使得该类成为一个监听器。用于监听整个容器生命周期的，主要是初始化和销毁的。类创建后要在web.xml配置文件中增加一个简单的监听器配置，即刚才我们定义的类。 <listener> <des
用nginx区分文件大小做出不同响应 ronin47
昨晚和前21v的同事聊天，说到我离职后一些技术上的更新。其中有个给某大客户(游戏下载类)的特殊需求设计，因为文件大小差距很大——估计是大版本和补丁的区别——又走的是同一个域名，而squid在响应比较大的文件时，尤其是初次下载的时候，性能比较差，所以拆成两组服务器，squid服务于较小的文件，通过pull方式从peer层获取，nginx服务于较大的文件，通过push方式由peer层分发同步。外部发布
java-67-扑克牌的顺子.从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的.2-10为数字本身，A为1，J为11，Q为12，K为13，而大 bylijinnan java
package com.ljn.base; import java.util.Arrays; import java.util.Random; public class ContinuousPoker { /** * Q67 扑克牌的顺子从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的。 * 2-10为数字本身，A为1，J为1
翟鸿燊老师语录 ccii 翟鸿燊
一、国学应用智慧TAT之亮剑精神A 1. 角色就是人格就像你一回家的时候，你一进屋里面，你已经是儿子，是姑娘啦，给老爸老妈倒怀水吧，你还觉得你是老总呢？还拿派呢？就像今天一样，你们往这儿一坐，你们之间是什么，同学，是朋友。还有下属最忌讳的就是领导向他询问情况的时候，什么我不知道，我不清楚，该你知道的你凭什么不知道
[光速与宇宙]进行光速飞行的一些问题 comsci 问题
在人类整体进入宇宙时代，即将开展深空宇宙探索之前，我有几个猜想想告诉大家仅仅是猜想。。。未经官方证实 1：要在宇宙中进行光速飞行，必须首先获得宇宙中的航行通行证，而这个航行通行证并不是我们平常认为的那种带钢印的证书，是什么呢？下面我来告诉
oracle undo解析 cwqcwqmax9 oracle
oracle undo解析2012-09-24 09:02:01 我来说两句作者：虫师收藏我要投稿 Undo是干嘛用的？ &nb
java中各种集合的详细介绍 dashuaifu java 集合
一，java中各种集合的关系图 Collection 接口的接口对象的集合 ├ List 子接口 &n
卸载windows服务的方法 dcj3sjt126com windows service
卸载Windows服务的方法在Windows中，有一类程序称为服务，在操作系统内核加载完成后就开始加载。这里程序往往运行在操作系统的底层，因此资源占用比较大、执行效率比较高，比较有代表性的就是杀毒软件。但是一旦因为特殊原因不能正确卸载这些程序了，其加载在Windows内的服务就不容易删除了。即便是删除注册表中的相应项目，虽然不启动了，但是系统中仍然存在此项服务，只是没有加载而已。如果安装其他
Warning: The Copy Bundle Resources build phase contains this target's Info.plist dcj3sjt126com ios xcode
http://developer.apple.com/iphone/library/qa/qa2009/qa1649.html Excerpt: You are getting this warning because you probably added your Info.plist file to your Copy Bundle
2014之C++学习笔记（一） Etwo C++Etwo Etwo iterator 迭代器
已经有很长一段时间没有写博客了，可能大家已经淡忘了Etwo这个人的存在，这一年多以来，本人从事了AS的相关开发工作，但最近一段时间，AS在天朝的没落，相信有很多码农也都清楚，现在的页游基本上达到饱和，手机上的游戏基本被unity3D与cocos占据，AS基本没有容身之处。so。。。最近我并不打算直接转型
js跨越获取数据问题记录 haifengwuch jsonp json Ajax
js的跨越问题，普通的ajax无法获取服务器返回的值。第一种解决方案，通过getson，后台配合方式，实现。 Java后台代码： protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { String ca
蓝色jQuery导航条 ini JavaScript html jquery Web html5
效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/39.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery鼠标悬停上下滑动导航条 - 柯乐义<
linux部署jdk,tomcat,mysql kerryg jdk tomcat linux mysql
1、安装java环境jdk: 一般系统都会默认自带的JDK,但是不太好用，都会卸载了，然后重新安装。 1.1）、卸载：（rpm -qa :查询已经安装哪些软件包； rmp -q 软件包：查询指定包是否已
DOMContentLoaded VS onload VS onreadystatechange mutongwu jquery js
1. DOMContentLoaded 在页面html、script、style加载完毕即可触发，无需等待所有资源（image/iframe）加载完毕。（IE9+） 2. onload是最早支持的事件，要求所有资源加载完毕触发。 3. onreadystatechange 开始在IE引入，后来其它浏览器也有一定的实现。涉及以下 document , applet, embed, fra
sql批量插入数据 qifeifei 批量插入
hi，自己在做工程的时候，遇到批量插入数据的数据修复场景。我的思路是在插入前准备一个临时表，临时表的整理就看当时的选择条件了，临时表就是要插入的数据集，最后再批量插入到数据库中。 WITH tempT AS ( SELECT item_id AS combo_id, item_id, now() AS create_date FROM a
log4j打印日志文件如何实现相对路径到项目工程下 thinkfreer Web log4j 应用服务器日志
最近为了实现统计一个网站的访问量，记录用户的登录信息，以方便站长实时了解自己网站的访问情况，选择了Apache 的log4j,但是在选择相对路径那块卡主了，X度了好多方法(其实大多都是一样的内用，还一个字都不差的)，都没有能解决问题，无奈搞了2天终于解决了，与大家分享一下需求：用户登录该网站时，把用户的登录名,ip,时间。统计到一个txt文档里，以方便其他系统调用此txt。项目名
linux下mysql-5.6.23.tar.gz安装与配置笑我痴狂 mysql linux unix
1.卸载系统默认的mysql [root@localhost ~]# rpm -qa | grep mysql mysql-libs-5.1.66-2.el6_3.x86_64 mysql-devel-5.1.66-2.el6_3.x86_64 mysql-5.1.66-2.el6_3.x86_64 [root@localhost ~]# rpm -e mysql-libs-5.1

Scikit-learn：开启量化价值投资的新征程