alpha xu

LangChain for Python: 基本使用场景与实现的实践

LangChain for Python: 基本使用场景与实现

文章目录

LangChain for Python: 基本使用场景与实现

目录

@[toc]

核心概念

典型使用场景

1. 文档问答系统

2. 对话机器人

3. 数据增强ETL

实现流程（重点介绍场景1）

1. 安装

2. 基本操作，引入llm(tongyi qwen-turbo)

3. 构建chain ：提示+模型+输出解析器

数据处理流程

组件说明

4. 简单的文档问答实现

完整示例：知识库问答系统

1. 环境准备：

手动下载NLTK数据（推荐）

用pycharm执行以下py程序，下载NLTK到C:\Users\Administrator\AppData\Roaming\nltk_data

2. 正式代码：

2.1 不对prompt进行设置，用默认的prompt

result输出内容

2.2 自定义Prompt的方式

运行情况

核心概念

LangChain是一个用于构建AI应用的框架，主要功能：

连接语言模型与其他数据源
管理对话上下文
构建复杂的工作流

核心组件：

LLM Provider (e.g. OpenAI)
│
├── Prompt Templates
├── Memory
├── Chains
└── Agents/Tools

典型使用场景

1. 文档问答系统

加载文档

文本分割

向量化存储

用户提问

相似度检索

生成回答

2. 对话机器人

用户输入

记忆上下文

语言模型

响应输出

3. 数据增强ETL

原始数据

LangChain处理

结构化输出

实现流程（重点介绍场景1）

1. 安装

!pip install langchain

2. 基本操作，引入llm(tongyi qwen-turbo)


from langchain_community.llms import Tongyi
import os

# 检查环境变量
DASHSCOPE_API_KEY = os.getenv('DASHSCOPE_API_KEY')
if not DASHSCOPE_API_KEY:
    raise ValueError("请设置 DASHSCOPE_API_KEY 环境变量")

# 模型配置
# EMBEDDING_MODEL = "text-embedding-v1"
LLM_MODEL = "qwen-turbo"  # 可以根据需要调整模型
llm = Tongyi(
            model_name=LLM_MODEL,
            temperature=0.7,
            dashscope_api_key=DASHSCOPE_API_KEY
        )
llm.invoke("中国的首都在哪里？")

    '中国的首都是北京。'

3. 构建chain ：提示+模型+输出解析器

# 创建提示模板
from langchain.prompts import ChatPromptTemplate
topic=""
prompt = ChatPromptTemplate.from_template("""
请基于用户输入的主题，编写一篇小红书营销短文。
主题：{topic}

回答：""")
from langchain_core.output_parsers import StrOutputParser
output_parser=StrOutputParser()
chain=prompt|llm|output_parser
chain.invoke({"topic":"大众ID4"})

    '✨城市探索新伙伴——大众ID.4，开启你的电动未来！\n\n你是否厌倦了燃油车的高油耗？...'

定义chain旧方法不建议使用

# from langchain.chains import LLMChain
# langChainDeprecationWarning: The class `LLMChain` was deprecated in LangChain 0.1.17 and will be removed in 1.0. Use :meth:`~RunnableSequence, e.g., `prompt | llm`` instead.
# chain = LLMChain(llm=llm, prompt=prompt)

chain=prompt|llm|output_parser 是管道拼接的功能，是以下三步的链接

prompt_value=prompt.invoke("人工智能将改变世界")
prompt_value

    ChatPromptValue(messages=[HumanMessage(content='\n请基于用户输入的主题，编写一篇小红书营销短文。\n主题：人工智能将改变世界\n\n回答：', additional_kwargs={}, response_metadata={})])

message= llm.invoke(prompt_value)
message

    '【未来已来 | 人工智能将如何改变我们的生活？】\n\n姐妹们！你有没有想过，有一天早晨醒来，...'

output_parser.invoke(message)

    '【未来已来 | 人工智能将如何改变我们的生活？】\n\n姐妹们！你有没有想过，有一天早晨醒来，...'

等同于：

chain=prompt|llm|output_parser
chain.invoke("人工智能将改变世界")

    '【未来已来，人工智能将如何改变我们的生活？】\n\n你是否曾幻想过像科幻电影里一样，...'

数据处理流程

Dict

Prompt Value

ChatMessage

String

input

Prompt Template

ChatModel

StrOutputParser

Result

组件说明

Dict
- 原始输入数据（字典格式）
PromptTemplate
- 将输入字典转换为标准提示模板
PromptValue
- 格式化后的提示值对象
ChatModel
- 语言模型处理核心
ChatMessage
- 模型生成的原始消息输出
StrOutputParser
- 输出解析器，功能包括：
  - 接受BaseOutput或BaseMessage作为输入
  - 将任何输入转换为字符串格式
String
- 标准化字符串输出
Result
- 最终处理结果

4. 简单的文档问答实现

使用langchain的WebBaseLoader，VectorstoreIndexCreator,DashScopeEmbeddings和FAISS向量数据库实现简单的RAG功能

from langchain.document_loaders import WebBaseLoader
from langchain.indexes import VectorstoreIndexCreator
from langchain_community.embeddings import DashScopeEmbeddings  # 使用DashScope的嵌入模型
from langchain_community.llms import Tongyi
from langchain_community.vectorstores import FAISS  # 显式指定向量存储
import os
# 0. 设置必要的环境变量
# os.environ["DASHSCOPE_API_KEY"] = "your-dashscope-api-key"  # 您的DashScope API Key，已经设置过
os.environ["USER_AGENT"] = "MyApp/1.0"  # 解决USER_AGENT警告
DASHSCOPE_API_KEY = os.getenv('DASHSCOPE_API_KEY')
EMBEDDING_MODEL = "text-embedding-v2"
LLM_MODEL = "qwen-turbo"  # 可以根据需要调整模型
if not DASHSCOPE_API_KEY:
        raise ValueError("请设置 DASHSCOPE_API_KEY 环境变量")
# 1. 配llm
from langchain_community.llms import Tongyi
llm = Tongyi(
            model_name=LLM_MODEL,
            temperature=0.7,
            dashscope_api_key=DASHSCOPE_API_KEY
        )

# 2. 创建DashScope的embedding
embedding = DashScopeEmbeddings(
    model = EMBEDDING_MODEL,  # 推荐使用的模型
    dashscope_api_key = DASHSCOPE_API_KEY
)

# 3. 配置IndexCreator（解决内存存储警告和embedding缺失问题）
# index_creator = VectorstoreIndexCreator(
#     embedding=embedding,
#     llm=llm,
#     vectorstore_kwargs={"persist_directory": "db"}  # 可选：持久化存储路径
# )
# 3. 正确配置IndexCreator
index_creator = VectorstoreIndexCreator(
    vectorstore_cls=FAISS,  # 显式指定向量存储
    embedding=embedding,
    # 注意：这里不再直接传入llm
)
# 4. 加载网页数据
loader = WebBaseLoader("https://blog.csdn.net/alva_xu/article/details/147249709")
index = index_creator.from_loaders([loader])

# 5. 提问查询
query = "这篇文章的主要观点是什么？"
result = index.query(question=query, llm=llm)  # 必须传入llm参数
result

'这篇文章的主要观点是介绍和对比了自然语言处理中的三种重要技术：N-Gram、TF-IDF 和 Word Embedding。文章详细解释了每种技术的基本概念、工作原理、优缺点以及应用场景，并通过实际案例展示了如何结合这些技术来解决具体问题，例如基于酒店描述的推荐系统。此外，文章还总结了 Word Embedding 的核心思想和常见方法（如 Word2Vec、GloVe、BERT），并指出了它们的优点和局限性。整体目的是帮助读者理解这些技术的特点及其在实际应用中的价值。'

完整示例：知识库问答系统

1. 环境准备：

! pip install unstructured

! pip install python-docx unstructured

! pip install nltk

! pip install --upgrade langchain-core langchain

手动下载NLTK数据（推荐）

1.手动下载数据包,并解压：
访问 https://github.com/nltk/nltk_data/tree/gh-pages/packages
下载以下两个zip文件：
tokenizers/punkt.zip
tokenizers/punkt_tab.zip
1. 手动安装：

import nltk
from nltk import data

# 指定自定义数据路径（可选）
custom_path = r'D:\cursorprj\langchain\ntlk_data'
nltk.data.path.append(custom_path)
from nltk.tokenize import sent_tokenize
text = "This is a test. This is another sentence."
sent_tokenize(text) # 应该输出句子列表




    ['This is a test.', 'This is another sentence.']

用pycharm执行以下py程序，下载NLTK到C:\Users\Administrator\AppData\Roaming\nltk_data

# import nltk
# nltk.download('punkt')       # 基础分词数据（必须）
# nltk.download('stopwords')   # 停用词（可选）
# nltk.download('averaged_perceptron_tagger')  # 词性标注（可选）
# nltk.download('wordnet')     # 词库（可选）
# nltk.download('averaged_perceptron_tagger_eng')
#测试
from nltk.tokenize import sent_tokenize
text = "This is a test. This is another sentence."
sent_tokenize(text) # 应该输出句子列表

    ['This is a test.', 'This is another sentence.']

2. 正式代码：

# 1. 准备数据
from langchain.document_loaders import (
    DirectoryLoader,
    TextLoader,
    UnstructuredWordDocumentLoader  # 处理doc文件
)


# 加载txt文件
txt_loader = DirectoryLoader(
    directory,
    glob="**/*.txt",
    loader_cls=TextLoader,
    show_progress=True
)

# 加载doc/docx文件
doc_loader = DirectoryLoader(
    directory,
    glob="**/*.doc*",  # 匹配.doc和.docx
    loader_cls=UnstructuredWordDocumentLoader,
    show_progress=True
)

# 合并所有文档
documents = txt_loader.load() + doc_loader.load()

documents

# 2. 分割文本
from langchain.text_splitter import RecursiveCharacterTextSplitter

directory = "./docs"  # 替换为你的文档目录路径
chunk_size = 500                     # 每个chunk的字符数
chunk_overlap = 50    # chunk之间的重叠字符数
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=chunk_size,
    chunk_overlap=chunk_overlap,
    separators=["\n\n", "\n", "。", "！", "？", "；", "……"],
    length_function=len,
    is_separator_regex=False
)
chunks = text_splitter.split_documents(documents)
chunks

print(f"\n共处理 {len(documents)} 个文档")
print(f"生成 {len(chunks)} 个文本块\n")
for i, chunk in enumerate(chunks[:3]):  # 显示前3个chunk
    print(f"Chunk {i+1}:")
    print("-"*40)
    print(chunk.page_content[:200] + "...")
    print(f"来源: {chunk.metadata['source']}")
    print("="*40 + "\n")


    共处理 3 个文档
    生成 62 个文本块
    
    Chunk 1:
    ----------------------------------------
    上海市数字经济发展“十四五”规划 
     ...
    ========================================
    
    Chunk 2:
    ----------------------------------------

    ...
    来源: docs\上海市数字经济发展.txt
    ========================================
    
    Chunk 3:
    ----------------------------------------
     ...
    来源: docs\上海市数字经济发展.txt
    ========================================

# 3. 实现知识库查询


from langchain_community.embeddings import DashScopeEmbeddings  # 使用DashScope的嵌入模型
from langchain_community.llms import Tongyi
from langchain_community.vectorstores import FAISS  # 显式指定向量存储
import os
# 0. 设置必要的环境变量
# os.environ["DASHSCOPE_API_KEY"] = "your-dashscope-api-key"  # 您的DashScope API Key，已经设置过
os.environ["USER_AGENT"] = "MyApp/1.0"  # 解决USER_AGENT警告
DASHSCOPE_API_KEY = os.getenv('DASHSCOPE_API_KEY')
EMBEDDING_MODEL = "text-embedding-v2"
LLM_MODEL = "qwen-turbo"  # 可以根据需要调整模型
if not DASHSCOPE_API_KEY:
        raise ValueError("请设置 DASHSCOPE_API_KEY 环境变量")
# 1. 配llm
from langchain_community.llms import Tongyi
llm = Tongyi(
            model_name=LLM_MODEL,
            temperature=0.7,
            dashscope_api_key=DASHSCOPE_API_KEY
        )

# 2. 创建DashScope的embedding

embedding = DashScopeEmbeddings(
    model = EMBEDDING_MODEL,  # 推荐使用的模型
    dashscope_api_key = DASHSCOPE_API_KEY
)
# 3.创建向量数据库
db = FAISS.from_documents(chunks, embedding)

2.1 不对prompt进行设置，用默认的prompt


# 4. 创建问答链
from langchain.chains import RetrievalQA
    
qa_chain = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",
    retriever=db.as_retriever(search_kwargs={"k": 3}),  # # 控制返回的文档数量为3
)
qa_chain
# prompt.input_variables
# db.as_retriever(search_kwargs={"k": 3})

# 5. 提问
question = "知识库中有哪些内容？"
result = qa_chain.invoke({"query": question})
result

result输出内容

    {'query': '知识库中有哪些内容？',
     'result': '根据提供的信息，知识库中包含以下内容：\n\n1. **数字内容相关**：\n   - 数字内容产业的新业态新模式。\n  ...'}

2.2 自定义Prompt的方式

# 6. 创建prompt
from langchain.prompts import PromptTemplate

template = """根据以下上下文信息回答问题：
{context}

问题：{question}
回答：
请用中文简洁回答，若不知道答案请如实说明。"""

QA_PROMPT = PromptTemplate(
    input_variables=["context", "question"],  # 必须包含这两个变量
    template=template
)

# 7. 创建问答链
from langchain.chains import RetrievalQA
    
qa_chain = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",
    retriever=db.as_retriever(search_kwargs={"k": 3}),  # # 控制返回的文档数量为3
    chain_type_kwargs={
        "prompt": QA_PROMPT,
        "document_variable_name": "context"  # 必须与模板变量名一致，context 的值是自动从检索器（retriever）获取并注入到 prompt 
    },
    return_source_documents=True  # 返回参考文档
)
# qa_chain
# prompt.input_variables
db.as_retriever(search_kwargs={"k": 3})




    VectorStoreRetriever(tags=['FAISS', 'DashScopeEmbeddings'], vectorstore=, search_kwargs={'k': 3})

# 8. 提问
# 问答循环
print("\n系统已准备就绪，可以开始提问了。输入'退出'结束对话。")
while True:
    question = input("\n请输入问题：")
    if question.lower() == '退出':
        break
        
    # 生成回答
    result = qa_chain.invoke({"query": question}) 
    # print(result)
    # 输出结果
    print("答案:", result["result"])
    print("\n参考文档:")
    for doc in result["source_documents"]:
        print(f"- {doc.page_content[:100]}...")  # 显示文档前100字符

运行情况

系统已准备就绪，可以开始提问了。输入'退出'结束对话。

请输入问题： 请问浦发银行客户经理违反规定要扣几分？
答案: 根据上下文信息，如果浦发银行客户经理在工作中有不廉洁自律的情况，每发现一次扣50分。其他违反规定的情况需具体分析，例如资产质量考核和逾期处理等，都有相应的扣分标准。若不知道具体违规类型，则无法确定扣分分数。

参考文档:
- 7、在工作中有不廉洁自律情况的每发现一次扣 50 分。

（二）个人资产质量考核：

当季考核收息率 97%以上为合格，每降 1 个百分点扣 2 分；不

良资产零为合格，每超一个个百分点扣 1 分。...
- 第八章 管理与奖惩

第十八条 个金客户经理管理机构为分行客户经理管理委员会。管理委员会组成人员：行长或主管业务副行长，个人业务部、人力资源部、风险管理部负责人。

第十九条 客户经理申报的各种信息必...
- 助理客户经理待遇按照人事部门对主办科员以下人员的待遇标准；客户经理待遇按照人事部门对主办科员的待遇标准；高级客户经理待遇按照人事部门对付科级的待遇标准；资深客户经理待遇按照人事部门对正科级的待遇标准。...

请输入问题：
↑↓ for history. Search history with c-↑/c-↓

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
python笔记14介绍几个魔法方法抢公主的大魔王 python python
python笔记14介绍几个魔法方法先声明一下各位大佬，这是我的笔记。如有错误，恳请指正。另外，感谢您的观看，谢谢啦！(1).__doc__输出对应的函数，类的说明文档print(print.__doc__)print(value,...,sep='',end='\n',file=sys.stdout,flush=False)Printsthevaluestoastream,ortosys.std
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
环境搭建 | Python + Anaconda / Miniconda + PyCharm 的安装、配置与使用
本文将分别介绍Python、Anaconda/Miniconda、PyCharm的安装、配置与使用，详细介绍Python环境搭建的全过程，涵盖Python、Pip、PythonLauncher、Anaconda、Miniconda、Pycharm等内容，以官方文档为参照，使用经验为补充，内容全面而详实。由于图片太多，就先贴一个无图简化版吧，详情请查看Python+Anaconda/Minicond
你竟然还在用克隆删除？Conda最新版rename命令全攻略！曦紫沐 Python基础知识 conda 虚拟环境管理
文章摘要Conda虚拟环境管理终于迎来革命性升级！本文揭秘Conda4.9+版本新增的rename黑科技，彻底告别传统“克隆+删除”的繁琐操作。从命令解析到实战案例，手把手教你如何安全高效地重命名Python虚拟环境，附带版本检测、环境迁移、故障排查等进阶技巧，助你提升开发效率10倍！一、颠覆认知：Conda居然自带重命名功能？很多开发者仍停留在“Conda无法直接重命名环境”的认知阶段，实际上自
centos7安装配置 Anaconda3
Anaconda是一个用于科学计算的Python发行版,Anaconda于Python，相当于centos于linux。下载[root@testsrc]#mwgethttps://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.2.0-Linux-x86_64.shBegintodownload:Anaconda3-5.2.0-L
Pandas：数据科学的超级瑞士军刀科技林总 DeepSeek学AI 人工智能
**——从零基础到高效分析的进化指南**###**一、Pandas诞生：数据革命的救世主****2010年前的数据分析噩梦**：```python#传统Python处理表格数据data=[]forrowincsv_file:ifrow[3]>100androw[2]=="China":data.append(float(row[5])#代码冗长易错！```**核心痛点**：-Excel处理百万行崩
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
机器学习必备数学与编程指南：从入门到精通 a小胡哦机器学习基础机器学习人工智能
一、机器学习核心数学基础1.线性代数（神经网络的基础）必须掌握：矩阵运算（乘法、转置、逆）向量空间与线性变换特征值分解与奇异值分解(SVD)为什么重要：神经网络本质就是矩阵运算学习技巧：用NumPy实际操作矩阵运算2.概率与统计（模型评估的关键）核心概念：条件概率与贝叶斯定理概率分布（正态、泊松、伯努利）假设检验与p值应用场景：朴素贝叶斯、A/B测试3.微积分（优化算法的基础）重点掌握：导数与偏导
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
【Jupyter】个人开发常见命令 TIM老师 #Pycharm &VSCode python Jupyter
1.查看python版本importsysprint(sys.version)2.ipynb/py文件转换jupyternbconvert--topythonmy_file.ipynbipynb转换为mdjupyternbconvert--tomdmy_file.ipynbipynb转为htmljupyternbconvert--tohtmlmy_file.ipynbipython转换为pdfju
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
用 Python 开发小游戏：零基础也能做出《贪吃蛇》
本文专为零基础学习者打造，详细介绍如何用Python开发经典小游戏《贪吃蛇》。无需复杂编程知识，从环境搭建到代码编写、功能实现，逐步讲解核心逻辑与操作。涵盖Pygame库的基础运用、游戏界面设计、蛇的移动与食物生成规则等，让新手能按步骤完成开发，同时融入SEO优化要点，帮助读者轻松入门Python游戏开发，体验从0到1做出游戏的乐趣。一、为什么选择用Python开发《贪吃蛇》对于零基础学习者来说，
基于Python的AI健康助手：开发与部署全攻略 AI算力网络与通信 AI算力网络与通信原理 AI人工智能大数据架构 python 人工智能开发语言 ai
基于Python的AI健康助手：开发与部署全攻略关键词：Python、AI健康助手、机器学习、自然语言处理、Flask、部署、健康管理摘要：本文将详细介绍如何使用Python开发一个AI健康助手，从需求分析、技术选型到核心功能实现，再到最终部署上线的完整过程。我们将使用自然语言处理技术理解用户健康咨询，通过机器学习模型提供个性化建议，并展示如何用Flask框架构建Web应用接口。文章包含大量实际代
GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
数据中台中的数据科学工作台：Jupyter集成方案 AI大数据智能洞察大数据与AI人工智能 jupyter 信息可视化 ide ai
数据中台中的数据科学工作台：Jupyter集成方案关键词：数据中台、数据科学工作台、JupyterNotebook、数据科学、机器学习、数据可视化、协作开发摘要：本文深入探讨了在数据中台架构中集成JupyterNotebook作为数据科学工作台的完整解决方案。我们将从数据中台的基本概念出发，详细分析Jupyter在数据科学工作流中的核心作用，介绍多种集成方案和技术实现细节，并通过实际案例展示如何构
lesson20：Python函数的标注你的电影很有趣 python 开发语言
目录引言：为什么函数标注是现代Python开发的必备技能一、函数标注的基础语法1.1参数与返回值标注1.2支持的标注类型1.3Python3.9+的重大改进：标准集合泛型二、高级标注技巧与最佳实践2.1复杂参数结构标注2.2函数类型与回调标注2.3变量注解与类型别名三、静态类型检查工具应用3.1mypy：最流行的类型检查器3.2Pyright与IDE集成3.3运行时类型验证四、函数标注的工程价值与
Jupyter Notebook：数据科学的“瑞士军刀” a小胡哦机器学习基础人工智能机器学习
在数据科学的世界里，JupyterNotebook是一个不可或缺的工具，它就像是数据科学家手中的“瑞士军刀”，功能强大且灵活多变。今天，就让我们一起深入了解这个神奇的工具。一、JupyterNotebook是什么？JupyterNotebook是一个开源的Web应用程序，它允许你创建和共享包含实时代码、方程、可视化和解释性文本的文档。它支持多种编程语言，其中Python是最常用的语言之一。Jupy
2018年中南大学中英翻译某翁
参考：20180827235856533.jpg【1】机器学习理论表明，机器学习算法能从有限个训练集样本上得到较好的泛化【1】Machinelearningtheoryshowsthatmachinelearningalgorithmcangeneralizewellfromfinitetrainingsetsampleslimited有限的infinite无限的【2】这似乎违背了一些基本的逻辑准
Django学习笔记（一）
学习视频为：pythondjangoweb框架开发入门全套视频教程一、安装pipinstalldjango==****检查是否安装成功django.get_version()二、django新建项目操作1、新建一个项目django-adminstartprojectproject_name2、新建APPcdproject_namedjango-adminstartappApp注：一个project
【三桥君】MCP中台，究竟如何实现多模型、多渠道、多环境的统一管控？如何以MCP为核心设计AI应用架构？三桥君《三桥君 MCP落地方法论》《三桥君 AI大模型落地方法论》#《三桥君 AI产品方法论》人工智能 AI产品经理 MCP API 三桥君系统架构 llama
你好，我是✨三桥君✨本文介绍>>一、引言随着人工智能技术的快速发展，越来越多的企业开始引入大语言模型（LLM）以提升用户体验和运营效率。然而，如何高效、稳定地将这些AI能力落地到生产环境呢？传统的系统架构往往难以应对AI应用的高并发、低延迟和灵活扩展需求，因此，从整体架构角度设计AI应用架构显得尤为重要。本文三桥君将深入探讨以MCP为核心的AI应用架构，并分析多种部署方式的优劣势，为企业在AI落地
Python 程序设计讲义（26）：字符串的用法——字符的编码睿思达DBA_WGX Python 讲义 python 开发语言
Python程序设计讲义（26）：字符串的用法——字符的编码目录Python程序设计讲义（26）：字符串的用法——字符的编码一、字符的编码二、`ASCII`编码三、`Unicode`编码四、使用`ord()`函数查询一个字符对应的`Unicode`编码五、使用`chr()`函数查询一个`Unicode`编码对应的字符六、`Python`字符串的特征一、字符的编码计算机默认只能处理二进制数，而不能处
【Python】pypinyin-汉字拼音转换工具鸟哥大大 Python python 自然语言处理
文章目录1.主要功能2.安装3.常用API3.1拼音风格3.2核心API3.2.1pypinyin.pinyin()3.2.2pypinyin.lazy_pinyin()3.2.3pypinyin.load_single_dict()3.2.4pypinyin.load_phrases_dict()3.2.5pypinyin.slug()3.3注册新的拼音风格4.基本用法4.1库导入4.2基本汉字
python编程第十四课：数据可视化小小源助手 Python代码实例信息可视化 python 开发语言
Python数据可视化：让数据“开口说话”在当今数据爆炸的时代，数据可视化已成为探索数据规律、传达数据信息的关键技术。Python凭借其丰富的第三方库，为数据可视化提供了强大而灵活的解决方案。本文将带你深入了解Matplotlib库的基础绘图、Seaborn库的高级可视化以及交互式可视化工具Plotly，帮助你通过图表清晰地展示数据背后的故事。一、Matplotlib库基础绘图Matplotlib
深入理解卷积神经网络（CNN）与循环神经网络（RNN） CodeJourney. cnn rnn 人工智能
在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
Python数据可视化：用代码绘制数据背后的故事 AAEllisonPang Python 信息可视化 python 开发语言
引言：当数据会说话在数据爆炸的时代，可视化是解锁数据价值的金钥匙。Python凭借其丰富的可视化生态库，已成为数据科学家的首选工具。本文将带您从基础到高级，探索如何用Python将冰冷数字转化为引人入胜的视觉叙事。一、基础篇：二维可视化的艺术表达1.1Matplotlib：可视化领域的瑞士军刀importmatplotlib.pyplotaspltimportnumpyasnpx=np.linsp
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l