带娃的IT创业者

《AI大模型应知应会100篇》第60篇：Pinecone 与 Milvus，向量数据库在大模型应用中的作用

第60篇：Pinecone与Milvus，向量数据库在大模型应用中的作用

摘要

本文将系统比较Pinecone与Milvus两大主流向量数据库的技术特点、性能表现和应用场景，提供详细的接入代码和最佳实践，帮助开发者为大模型应用选择并优化向量存储解决方案。

引言：为什么需要向量数据库？

随着AI大模型的发展，向量数据（如文本、图像的嵌入表示）成为处理非结构化数据的核心方式。然而，传统的数据库无法高效地处理高维向量的相似性搜索问题。因此，向量数据库应运而生。

什么是向量数据库？

向量数据库是一种专门用于存储和检索高维向量数据的数据库。它支持快速执行近似最近邻搜索（ANN），即找出与目标向量最接近的一组向量。

向量数据库的应用场景

推荐系统：基于用户行为向量进行个性化推荐。
语义搜索：通过文本嵌入实现文档或网页内容的语义匹配。
图像检索：利用图像特征向量进行相似图片查找。
RAG（Retrieval-Augmented Generation）：结合知识库与大模型生成更准确的回答。

核心概念与知识点

1. 向量数据库基础

向量嵌入基础

向量嵌入是将非结构化数据（如文本、图像）转换为固定维度的数值向量的过程。例如：

使用 text-embedding-ada-002 将文本转换为 1536 维向量。
使用 CLIP 模型将图像转换为 512 维向量。

from openai import OpenAI

client = OpenAI()
response = client.embeddings.create(
    input="这是一个示例文本",
    model="text-embedding-ada-002"
)
embedding = response.data[0].embedding
print(len(embedding))  # 输出: 1536

相似性搜索原理

常见的相似性度量方法包括：

余弦相似度（Cosine Similarity）：衡量两个向量之间的夹角。
欧氏距离（Euclidean Distance）：衡量两个向量之间的直线距离。

通常使用余弦相似度来判断两个向量是否“语义上”相似。

索引类型对比

索引类型	特点	适用场景
HNSW (Hierarchical Navigable Small World)	高效且支持动态更新	实时推荐系统
IVF (Inverted File Index)	快速但不支持频繁更新	批量处理场景
FLAT	精确但慢	小规模数据

向量数据库与传统数据库的区别

对比项	传统数据库	向量数据库
数据类型	结构化数据（如整数、字符串）	高维向量
查询方式	精确匹配（如 SQL WHERE 条件）	近似最近邻搜索（ANN）
性能	插入/查询速度快	支持大规模向量数据的高效检索

Pinecone实战应用

账户设置与索引创建

Pinecone 是一个云托管的向量数据库服务，适合不想自己部署服务器的开发者。

安装依赖

pip install pinecone-client openai

初始化 Pinecone 并创建索引

import pinecone
from openai import OpenAI

# 初始化 Pinecone
pinecone.init(api_key="your-api-key", environment="your-environment")

# 创建索引（如果不存在）
if "knowledge-base" not in pinecone.list_indexes():
    pinecone.create_index(
        name="knowledge-base",
        dimension=1536,  # OpenAI ada-002 的输出维度
        metric="cosine"
    )

# 连接到索引
index = pinecone.Index("knowledge-base")

插入向量

client = OpenAI()

# 生成向量嵌入
embeddings = client.embeddings.create(
    input="需要向量化的文本内容",
    model="text-embedding-ada-002"
).data[0].embedding

# 插入向量
index.upsert(
    vectors=[
        {
            "id": "doc1",
            "values": embeddings,
            "metadata": {"source": "article", "author": "Zhang San"}
        }
    ]
)

相似性搜索

results = index.query(
    vector=embeddings,
    top_k=3,
    include_metadata=True
)

for result in results['matches']:
    print(f"ID: {result['id']}, Score: {result['score']}, Metadata: {result['metadata']}")

输出示例

ID: doc1, Score: 0.987, Metadata: {'source': 'article', 'author': 'Zhang San'}
ID: doc2, Score: 0.876, Metadata: {'source': 'blog', 'author': 'Li Si'}
ID: doc3, Score: 0.765, Metadata: {'source': 'wiki', 'author': 'Wang Wu'}

Milvus实战应用

部署与集群配置

Milvus 是一个开源的向量数据库，支持本地部署和分布式架构，适合对数据隐私要求较高的企业。

安装 Milvus

使用 Docker 快速启动：

docker run -d --name milvusdb -p 19530:19530 milvusdb/milvus:v2.4.3

Python 客户端连接

pip install pymilvus numpy

连接 Milvus 并插入数据

from pymilvus import connections, Collection, utility
import numpy as np

# 连接 Milvus
connections.connect(host='localhost', port='19530')

# 创建集合
collection_name = "document_store"

if utility.has_collection(collection_name):
    collection = Collection(collection_name)
else:
    from pymilvus import FieldType, CollectionSchema, DataType
    fields = [
        {"name": "id", "type": DataType.INT64, "is_primary": True},
        {"name": "embedding", "type": DataType.FLOAT_VECTOR, "dim": 1536},
        {"name": "source", "type": DataType.VARCHAR, "max_length": 256},
        {"name": "author", "type": DataType.VARCHAR, "max_length": 256}
    ]
    schema = CollectionSchema(fields, description="Document Store")
    collection = Collection(collection_name, schema=schema)

# 插入数据
import random

num_entities = 1000
ids = [i for i in range(num_entities)]
embeddings = [[random.random() for _ in range(1536)] for _ in range(num_entities)]
sources = ["article"] * num_entities
authors = ["Zhang San"] * num_entities

collection.insert([ids, embeddings, sources, authors])
collection.flush()

向量搜索

search_params = {"metric_type": "COSINE", "params": {"nprobe": 10}}
results = collection.search(
    data=[embeddings[0]],
    anns_field="embedding",
    param=search_params,
    limit=3,
    expr="source == 'article'",
    output_fields=["source", "author"]
)

for hit in results[0]:
    print(f"ID: {hit.id}, Distance: {hit.distance}, Source: {hit.entity.get('source')}")

输出示例

ID: 0, Distance: 0.0, Source: article
ID: 123, Distance: 0.123, Source: article
ID: 456, Distance: 0.135, Source: article

应用架构与集成

与 LangChain 集成

LangChain 是一个强大的框架，可以轻松集成向量数据库。

安装依赖

pip install langchain pinecone-client pymilvus openai

Pinecone 集成

from langchain.vectorstores import Pinecone as LangchainPinecone
from langchain.embeddings.openai import OpenAIEmbeddings

embeddings = OpenAIEmbeddings()
vectorstore = LangchainPinecone.from_existing_index(
    index_name="knowledge-base",
    embedding=embeddings,
    text_key="content"
)

Milvus 集成

from langchain.vectorstores import Milvus as LangchainMilvus

milvus_store = LangchainMilvus(
    embedding_function=embeddings,
    collection_name="document_store",
    connection_args={"host": "localhost", "port": "19530"}
)

性能与选型对比

对比项	Pinecone	Milvus
部署方式	云托管	自托管/云托管
易用性	高（开箱即用）	中等（需部署）
成本	按 API 调用计费	开源免费
扩展性	自动扩展	支持分布式部署
社区活跃度	商业支持	开源社区活跃
功能丰富度	丰富	更加灵活可定制

实战案例

案例一：企业搜索引擎

需求：亿级文档的向量检索系统。
方案：
- 使用 Milvus 构建本地向量数据库。
- 使用 Elasticsearch 做关键词搜索。
- 使用 LangChain 整合两者实现混合搜索。

案例二：个性化推荐

需求：根据用户历史行为推荐相关内容。
方案：
- 用户行为向量化。
- 使用 Pinecone 进行实时相似性搜索。
- 返回相似用户的偏好内容作为推荐结果。

实战案例：完整代码与部署指南

案例一：企业搜索引擎（Milvus + Elasticsearch + LangChain）

1. 系统架构设计

[用户查询] 
    ↓
[LangChain混合搜索]
    ├─→ [Elasticsearch关键词搜索]
    └─→ [Milvus向量相似性搜索]
    ↓
[结果融合排序]
    ↓
[最终返回结果]

2. 技术栈要求

pip install pymilvus elasticsearch langchain openai sentence-transformers fastapi uvicorn
docker pull milvusdb/milvus:v2.4.3
docker pull docker.elastic.co/elasticsearch/elasticsearch:8.11.3

3. Milvus向量数据库初始化

from pymilvus import connections, Collection, utility, FieldSchema, CollectionSchema, DataType

# 连接Milvus
connections.connect(host='localhost', port='19530')

# 创建集合
collection_name = "document_vectors"

if not utility.has_collection(collection_name):
    fields = [
        FieldSchema(name="doc_id", dtype=DataType.INT64, is_primary=True),
        FieldSchema(name="embedding", dtype=DataType.FLOAT_VECTOR, dim=768),
        FieldSchema(name="title", dtype=DataType.VARCHAR, max_length=512),
        FieldSchema(name="content", dtype=DataType.VARCHAR, max_length=65535)
    ]
    schema = CollectionSchema(fields, description="文档向量存储")
    collection = Collection(collection_name, schema=schema)
    
    # 创建索引
    index_params = {
        "index_type": "IVF_FLAT",
        "params": {"nlist": 1024},
        "metric_type": "COSINE"
    }
    collection.create_index(field_name="embedding", index_params=index_params)
else:
    collection = Collection(collection_name)

collection.load()

4. Elasticsearch关键词索引创建

from elasticsearch import Elasticsearch
from elasticsearch_dsl import analyzer

# 连接Elasticsearch
es_client = Elasticsearch(hosts=["http://localhost:9200"])

# 创建索引
index_name = "document_search"

if not es_client.indices.exists(index=index_name):
    es_client.indices.create(
        index=index_name,
        body={
            "settings": {
                "analysis": {
                    "analyzer": {
                        "custom_analyzer": {
                            "type": "custom",
                            "tokenizer": "whitespace",
                            "filter": ["lowercase", "stop", "stemmer"]
                        }
                    }
                }
            },
            "mappings": {
                "properties": {
                    "title": {"type": "text", "analyzer": "custom_analyzer"},
                    "content": {"type": "text", "analyzer": "custom_analyzer"}
                }
            }
        }
    )

5. 向量化处理服务

from sentence_transformers import SentenceTransformer

class VectorService:
    def __init__(self):
        self.model = SentenceTransformer('all-MiniLM-L6-v2')
        
    def text_to_vector(self, text: str) -> List[float]:
        return self.model.encode(text).tolist()
        
vector_service = VectorService()

6. LangChain混合搜索实现

from langchain.vectorstores import Milvus
from langchain.schema import Document
from langchain.embeddings import HuggingFaceEmbeddings

# 初始化嵌入模型
embeddings = HuggingFaceEmbeddings(model_name="all-MiniLM-L6-v2")

# 连接Milvus向量数据库
milvus_store = Milvus(
    embedding_function=embeddings,
    collection_name=collection_name,
    connection_args={"host": "localhost", "port": "19530"}
)

def hybrid_search(query: str, top_k: int = 5):
    # 向量搜索
    vector_results = milvus_store.similarity_search(query, k=top_k)
    
    # 关键词搜索
    es_results = es_client.search(
        index=index_name,
        body={"query": {"multi_match": {"query": query, "fields": ["title^2", "content"]}}}
    )
    
    # 结果融合
    combined_results = []
    for hit in es_results['hits']['hits']:
        combined_results.append({
            "source": "elasticsearch",
            "score": hit['_score'],
            "title": hit['_source']['title'],
            "content": hit['_source']['content']
        })
        
    for doc in vector_results:
        combined_results.append({
            "source": "milvus",
            "score": doc.metadata.get("distance", 0),
            "title": doc.metadata.get("title", ""),
            "content": doc.page_content
        })
    
    # 按分数排序
    combined_results.sort(key=lambda x: x["score"], reverse=True)
    return combined_results[:top_k]

7. 部署指南

# 启动Milvus
docker run -d --name milvusdb -p 19530:19530 milvusdb/milvus:v2.4.3

# 启动Elasticsearch
docker run -d --name es-node -p 9200:9200 \
  -e "discovery.type=single-node" \
  -e "ES_JAVA_OPTS=-Xms1g -Xmx1g" \
  docker.elastic.co/elasticsearch/elasticsearch:8.11.3

# 安装依赖
pip install -r requirements.txt

# 启动API服务
uvicorn search_api:app --host 0.0.0.0 --port 8000

案例二：个性化推荐系统（Pinecone + 用户行为分析）

1. 系统架构设计

[用户行为数据]
    ↓
[特征工程处理]
    ↓
[Pinecone向量存储]
    ↓
[相似用户查找]
    ↓
[内容推荐生成]

2. 技术栈要求

pip install pinecone-client openai pandas numpy scikit-learn fastapi uvicorn

3. Pinecone初始化

import pinecone
from openai import OpenAI

# 初始化Pinecone
pinecone.init(api_key="your-api-key", environment="northamerica-northeast1-gcp")

# 创建索引
index_name = "user-behavior"

if index_name not in pinecone.list_indexes():
    pinecone.create_index(
        name=index_name,
        dimension=1536,  # OpenAI嵌入维度
        metric="cosine"
    )

# 连接索引
index = pinecone.Index(index_name)
client = OpenAI()

4. 用户行为向量化

import pandas as pd
from sklearn.preprocessing import StandardScaler

class UserBehaviorVectorizer:
    def __init__(self):
        self.scaler = StandardScaler()
        
    def _extract_features(self, user_data: dict) -> pd.DataFrame:
        # 特征提取示例
        features = {
            "avg_session_time": user_data.get("session_duration", 0),
            "click_rate": len(user_data.get("clicked_items", [])) / max(1, user_data.get("impressions", 1)),
            "purchase_frequency": len(user_data.get("purchases", [])) / max(1, user_data.get("days_active", 1)),
            "category_preference": user_data.get("preferred_category", "other"),
            "device_usage": user_data.get("device_type", "desktop"),
            "location": user_data.get("location", "unknown")
        }
        return pd.DataFrame([features])
        
    def _normalize_features(self, df: pd.DataFrame) -> np.ndarray:
        # 数值特征标准化
        numerical = self.scaler.fit_transform(df[["avg_session_time", "click_rate", "purchase_frequency"]])
        
        # 类别特征one-hot编码
        categorical = pd.get_dummies(df[["category_preference", "device_usage", "location"]])
        
        # 合并特征
        return np.hstack([numerical, categorical.values])
        
    def vectorize(self, user_data: dict) -> List[float]:
        df = self._extract_features(user_data)
        features = self._normalize_features(df)
        
        # 使用OpenAI嵌入进行降维
        response = client.embeddings.create(
            input=features.tolist()[0],
            model="text-embedding-ada-002"
        )
        return response.data[0].embedding

5. 推荐引擎实现

class RecommendationEngine:
    def __init__(self):
        self.user_vectorizer = UserBehaviorVectorizer()
        
    def add_user(self, user_id: str, user_data: dict):
        # 向量化用户行为
        vector = self.user_vectorizer.vectorize(user_data)
        
        # 存储到Pinecone
        index.upsert(vectors=[{
            "id": user_id,
            "values": vector,
            "metadata": {
                "preferences": user_data.get("preferred_categories", []),
                "recent_purchases": user_data.get("recent_purchases", []),
                "location": user_data.get("location", "")
            }
        }])
        
    def get_recommendations(self, user_id: str, top_k: int = 5):
        # 获取用户向量
        result = index.fetch(ids=[user_id])
        if not result.vectors:
            return []
            
        user_vector = result.vectors[user_id].values
        
        # 查找相似用户
        similar_users = index.query(
            vector=user_vector,
            top_k=top_k+1,  # 排除自己
            include_metadata=True
        )
        
        # 过滤出相似用户的偏好
        recommendations = []
        for match in similar_users.matches:
            if match.id == user_id:
                continue
                
            metadata = match.metadata
            recommendations.extend(metadata.get("recent_purchases", []))
            
        # 去重并返回
        return list(set(recommendations))[:top_k]

6. API接口实现

from fastapi import FastAPI, HTTPException
from pydantic import BaseModel

app = FastAPI()

class UserData(BaseModel):
    session_duration: float
    clicked_items: List[str]
    impressions: int
    purchases: List[str]
    days_active: int
    preferred_category: str
    device_type: str
    location: str

recommendation_engine = RecommendationEngine()

@app.post("/users/{user_id}/update")
async def update_user_profile(user_id: str, user_data: UserData):
    try:
        recommendation_engine.add_user(user_id, user_data.dict())
        return {"status": "success"}
    except Exception as e:
        raise HTTPException(status_code=500, detail=str(e))

@app.get("/users/{user_id}/recommendations")
async def get_recommendations(user_id: str, top_k: int = 5):
    try:
        results = recommendation_engine.get_recommendations(user_id, top_k)
        return {"recommendations": results}
    except Exception as e:
        raise HTTPException(status_code=500, detail=str(e))

7. 部署指南

# 设置环境变量
export PINECONE_API_KEY="your-pinecone-api-key"
export OPENAI_API_KEY="your-openai-api-key"

# 安装依赖
pip install -r requirements.txt

# 启动服务
uvicorn recommendation_api:app --host 0.0.0.0 --port 8000

扩展建议

1. 性能优化

对于企业搜索引擎：
- 使用Milvus的分片功能支持亿级数据
- 在Elasticsearch中使用倒排索引优化关键词搜索
- 引入缓存层（如Redis）存储高频查询结果

2. 安全加固

添加身份验证（JWT/OAuth）
对敏感数据进行加密存储
实现速率限制防止滥用

3. 监控方案

Prometheus + Grafana监控系统指标
ELK日志分析体系
设置异常报警规则

4. 可扩展性设计

将计算密集型任务移至Celery异步任务队列
使用Kubernetes进行容器编排
为不同模块设计独立的微服务架构

以上两个实战案例提供了完整的代码实现和部署指南，可根据具体需求进一步扩展和优化。

优化与故障排除

性能调优清单

索引类型选择：根据数据量和查询频率选择合适的索引。
批量插入：避免单条插入，使用批量插入提高效率。
内存优化：适当调整索引参数以减少内存占用。
缓存机制：对高频查询结果进行缓存。

常见问题与解决方案

问题	解决方案
向量维度不匹配	检查模型输出维度是否一致
查询超时	增加超时时间或优化索引
内存溢出	减少索引分片数或升级硬件
插入失败	检查主键唯一性约束

总结与扩展思考

未来趋势

多模态检索：支持文本、图像、音频等多种数据类型的统一检索。
混合搜索：结合关键词搜索与向量搜索，提升搜索准确性。
边缘计算：向量数据库将在边缘设备中得到更多应用。

学习资源推荐

Pinecone 官方文档
Milvus 官方文档
LangChain 官方文档
OpenAI Embeddings API 文档

如果你喜欢这篇文章，请点赞、收藏，并分享给你的朋友！欢迎关注我的专栏《AI大模型应知应会100篇》，获取更多实用技术干货！

什么是缓存雪崩？缓存击穿？缓存穿透？分别如何解决？什么是缓存预热？ daixin8848 缓存 redis java 开发语言
缓存雪崩：在一个时间段内，有大量的key过期，或者Redis服务宕机，导致大量的请求到达数据库,带来巨大压力-给key设置不同的TTL、利用Redis集群提高服务的高可用性、添加多级缓存、添加降级流策略缓存击穿：给某一个key设置了过期时间，当key过期的时间，恰好这个时间点有大量的并发请求访问这个key，可能会瞬间把数据库压垮-互斥锁：缓存失败时，只允许一个请求去加载数据并更新缓存，其他请求阻塞
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
MySQL复习题
一.填空题1.关系数据库的标准语言是SQL。2.数据库发展的3个阶段中，数据独立性最高的是阶段数据库系统。3.概念模型中的3种基本联系分别是一对一、一对多和多对多。4.MySQL配置文件的文件名是my.ini或my.cnf。5.在MySQL配置文件中，datadir用于指定数据库文件的保存目录。6.添加IFNOTEXISTS可在创建的数据库已存在时防止程序报错。7.MySQL提供的SHOWCREA
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
Android GreenDao介绍和Generator生成表对象代码
目录(?)[-]介绍创建工程转载请注明：http://blog.csdn.net/sinat_30276961/article/details/50052109最近无意中发现了GreenDao，然后查看了一些资料后，发现这个数据库框架很适合用，于是乎，查看了官网的api，并自己写了一个小应用总结一下它的使用方法。介绍按照国际惯例，在开篇，总要先介绍一下什么是GreenDao吧。首先需要说明的是Gr
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
Mac OSX 下的mysql数据库文件存放位置 Bruuuces mysql mac osx 位置存放
之前我的mysql的系统数据库里的表被我玩坏了，万般无奈之下只得删除所有mysql的东西重新构建数据库。按照网上搜到的内容删除后重装发现数据库没有什么变化。于是自己在每个可能存放数据库文件的目录查找，最终确认目录位置如下:使用HomeBrew安装为/usr/local/var/mysql使用官方下载的dmg镜像安装为/usr/local/mysql删除这个目录再重新安装mysql就会重新生成系统数
【三桥君】MCP中台，究竟如何实现多模型、多渠道、多环境的统一管控？如何以MCP为核心设计AI应用架构？三桥君《三桥君 MCP落地方法论》《三桥君 AI大模型落地方法论》#《三桥君 AI产品方法论》人工智能 AI产品经理 MCP API 三桥君系统架构 llama
你好，我是✨三桥君✨本文介绍>>一、引言随着人工智能技术的快速发展，越来越多的企业开始引入大语言模型（LLM）以提升用户体验和运营效率。然而，如何高效、稳定地将这些AI能力落地到生产环境呢？传统的系统架构往往难以应对AI应用的高并发、低延迟和灵活扩展需求，因此，从整体架构角度设计AI应用架构显得尤为重要。本文三桥君将深入探讨以MCP为核心的AI应用架构，并分析多种部署方式的优劣势，为企业在AI落地
mac升级mysql_Mac OSX下的MySQL数据库升级 weixin_39801714 mac升级mysql
MacOSX下的数据库升级最麻烦的不过权限的问题.本文的MySQL的安装方式为OSX下DMG磁盘镜像的安装方式,MacPorts/Homebrew的方式大同小异.从5.6.17升级到5.7.18安装目录信息ls-al/usr/local|grepmysqllrwxr-xr-x1rootwheel30B52100:39mysql@->mysql-5.6.17-osx10.7-x86_64drwxr-
深入理解卷积神经网络（CNN）与循环神经网络（RNN） CodeJourney. cnn rnn 人工智能
在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
【MySQL】MySQL数据库如何改名武昌库里写JAVA 面试题汇总与解析 spring boot vue.js sql java 学习
MySQL建库授权语句https://www.jianshu.com/p/2237a9649ceeMySQL数据库改名的三种方法https://www.cnblogs.com/gomysql/p/3584881.htmlMySQL安全修改数据库名几种方法https://blog.csdn.net/haiross/article/details/51282417MySQL重命名数据库https://
HikariCP调试日志深度解析：生产环境故障排查完全指南
HikariCP调试日志深度解析：生产环境故障排查完全指南更新时间：2025年7月4日|作者：资深架构师|适用版本：HikariCP5.x+|难度等级：中高级前言在生产环境中，数据库连接池往往是系统性能的关键瓶颈。HikariCP作为当前最流行的Java连接池，其调试日志包含了丰富的运行时信息，能够帮助我们快速定位和解决各种连接池相关问题。本文将深入解析HikariCP的日志体系，提供一套完整的故
大学社团管理系统（11831） codercode2022 java spring boot spring echarts spring cloud sentinel java-rocketmq
有需要的同学，源代码和配套文档领取，加文章最下方的名片哦一、项目演示项目演示视频二、资料介绍完整源代码（前后端源代码+SQL脚本）配套文档（LW+PPT+开题报告）远程调试控屏包运行三、技术介绍Java语言SSM框架SpringBoot框架Vue框架JSP页面Mysql数据库IDEA/Eclipse开发四、项目截图有需要的同学，源代码和配套文档领取，加文章最下方的名片哦!
今年校招竞争真激烈 12_05
程序员满大街，都要找不到工作了。即使人工智能满大街，我也后悔当初没学机器学习，后悔当初没学Java。C++真难找工作。难道毕了业就失业吗？好担心！
前端数据库：IndexedDB从基础到高级使用指南
文章目录前端数据库：IndexedDB从基础到高级使用指南引言一、IndexedDB概述1.1什么是IndexedDB1.2与其他存储方案的比较二、基础使用2.1打开/创建数据库2.2基本CRUD操作添加数据读取数据更新数据删除数据三、高级特性3.1复杂查询与游标3.2事务高级用法3.3性能优化技巧四、实战案例：构建离线优先的待办事项应用4.1数据库设计4.2同步策略实现五、常见问题与解决方案5.
修改gitlab默认的语言 Victor刘 gitlab
文章目录网上的方法1.采用数据库触发器的方法2.登录pg库2.1查看表2.2创建function2.3创建触发器2.4修改历史数据网上的方法网上修改/opt/gitlab/embedded/service/gitlab-rails/config/application.rb的方法，我试了，没生效，没进一步研究1.采用数据库触发器的方法2.登录pg库su-gitlab-psqlpsql-h/var/
如何运用深度学习打造高效AI人工智能系统 AI智能探索者 AI Agent 智能体开发实战人工智能深度学习 ai
如何运用深度学习打造高效AI人工智能系统关键词：深度学习、AI系统、神经网络、模型优化、实战开发摘要：本文将从深度学习的核心概念出发，结合生活实例和代码实战，系统讲解如何构建高效AI系统。我们会拆解数据准备、模型设计、训练优化、部署落地的全流程，揭秘“数据-模型-训练-推理”的协同机制，并通过具体案例演示从0到1开发AI系统的关键技巧，帮助开发者掌握打造高效AI系统的底层逻辑。背景介绍目的和范围在
如何在 Ubuntu 24.04 或 22.04 Linux 上安装和运行 Redis 服务器山岚的运维笔记 Linux 运维及使用 linux 服务器 ubuntu redis 数据库
Redis（RemoteDictionaryServer，远程字典服务器）是一种内存数据结构存储，通常用作NoSQL数据库、缓存和消息代理。它是开源的，因此用户可以免费安装，无需支付任何费用。Redis旨在为需要快速数据访问和低延迟的应用程序提供速度和效率。Redis支持多种数据类型，包括字符串（Strings）、列表（Lists）、集合（Sets）、哈希（Hashes）、有序集合（SortedS
数据库基础概念梳理 22:30Plane-Moon 数据库
1.数据存储类型表(Table):存储结构化数据的标准方式，数据以行和列的形式组织，具有固定的格式。非结构化数据(UnstructuredData):如音频、视频、图片、文本文档等，其格式不固定，不易直接用表存储。2.SQL的核心优势SQL尤其擅长处理和操作存储在表中的结构化数据。2.1数据类型约束(DataTypeConstraints):定义列可存储的数据种类。整数类型:TINYINT(1字节
SQL笔记纯干货 AI入门修炼 oracle 数据库 sql
软件：DataGrip2023.2.3，phpstudy_pro,MySQL8.0.12目录1.DDL语句（数据定义语句）1.1数据库操作语言1.2数据表操作语言2.DML语句（数据操作语言）2.1增删改2.2题2.3备份表3.DQL语句（数据查询语言）3.1查询操作3.2题一3.3题二4.多表详解4.1一对多4.2多对多5.多表查询6.窗口函数7.拓展:upsert8.sql注入攻击演示9.拆表
非欧空间计算加速：图神经网络与微分几何计算的GPU优化（流形数据的内存布局优化策略）九章云极AladdinEdu 空间计算神经网络人工智能 gpu算力算法 java 开发语言
一、非欧空间计算的革命性意义与核心挑战在三维形状分析、社交网络建模、分子动力学模拟等领域，非欧几里得空间数据（流形数据）的处理正推动人工智能技术向更复杂的几何结构迈进。传统欧式空间优化方法在处理流形数据时面临根本性局限：黎曼度量导致距离计算失效、局部坐标系动态变化引发内存访问模式混乱、曲率变化影响并行计算效率。本文提出基于分块流形存储（BlockedManifoldStorage,BMS）与层次化
分布式全局唯一ID生成：雪花算法 vs Redis Increment，怎么选？
雪花算法vsRedisIncrement：分布式全局唯一ID生成方案深度对比在分布式系统开发中，“全局唯一ID”是绕不开的核心问题。无论是分库分表的数据库设计、订单编号的唯一性保证，还是日志追踪的链路标识，都需要一套可靠的ID生成方案。今天我们就来聊聊两种主流方案——雪花算法（Snowflake）和RedisIncrement，并从原理、特性到适用场景，帮你理清如何选择。同时，我们还将对比其他常见
【Druid】学习笔记 fixAllenSun 学习笔记 oracle
【Druid】学习笔记【一】简介【1】简介【2】数据库连接池（1）能解决的问题（2）使用数据库连接池的好处【3】监控（1）监控信息采集的StatFilter（2）监控不影响性能（3）SQL参数化合并监控（4）执行次数、返回行数、更新行数和并发监控（5）慢查监控（6）Exception监控（7）区间分布（8）内置监控DEMO【4】Druid基本配置参数介绍【5】Druid相比于其他数据库连接池的优点
构建高效的物流车辆定位管理系统体制教科书
本文还有配套的精品资源，点击获取简介：物流车辆定位管理系统利用信息技术提高物流效率和安全性。通过集成GPS技术进行实时车辆追踪和监控，它提供及时的货物运送和异常处理。系统的关键技术包括GPS车辆定位、C#编程语言、数据库管理、车辆管理、在途情况监控、预警与通知、数据分析与报告、用户界面设计、安全性与隐私保护以及系统集成。这些要素共同保障物流流程的高效、安全和智能化。1.物流车辆定位管理系统的应用与
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite

《AI大模型应知应会100篇》第60篇：Pinecone 与 Milvus，向量数据库在大模型应用中的作用

第60篇：Pinecone与Milvus，向量数据库在大模型应用中的作用

摘要

引言：为什么需要向量数据库？

什么是向量数据库？

向量数据库的应用场景

核心概念与知识点

1. 向量数据库基础

向量嵌入基础

相似性搜索原理

索引类型对比

向量数据库与传统数据库的区别

Pinecone实战应用

账户设置与索引创建

安装依赖

初始化 Pinecone 并创建索引

插入向量

相似性搜索

输出示例

Milvus实战应用

部署与集群配置

安装 Milvus

Python 客户端连接

连接 Milvus 并插入数据

向量搜索

输出示例

应用架构与集成

与 LangChain 集成

安装依赖

Pinecone 集成

Milvus 集成

性能与选型对比

实战案例

案例一：企业搜索引擎

案例二：个性化推荐

实战案例：完整代码与部署指南

案例一：企业搜索引擎（Milvus + Elasticsearch + LangChain）

1. 系统架构设计

2. 技术栈要求

3. Milvus向量数据库初始化

4. Elasticsearch关键词索引创建

5. 向量化处理服务

6. LangChain混合搜索实现

7. 部署指南

案例二：个性化推荐系统（Pinecone + 用户行为分析）

1. 系统架构设计

2. 技术栈要求

3. Pinecone初始化

4. 用户行为向量化

5. 推荐引擎实现

6. API接口实现

7. 部署指南

扩展建议

1. 性能优化

2. 安全加固

3. 监控方案

4. 可扩展性设计

优化与故障排除

性能调优清单

常见问题与解决方案

总结与扩展思考

未来趋势

学习资源推荐

你可能感兴趣的:(人工智能,milvus,数据库)