python_知世

Ollama + AnythingLLM +Weaviate 架构搭建 DeepSeek 知识库

前言

随着人工智能技术的快速发展，构建智能化的知识库系统成为了提升业务效率、加速信息流转的重要途径。DeepSeek知识库旨在结合最新的AI技术，帮助企业和个人在海量信息中精准获取所需的知识。本文将介绍如何通过Ollama、AnythingLLM和Weaviate三者的结合搭建DeepSeek知识库架构，提升数据检索、智能问答以及知识管理的能力。

系统环境

• 操作系统版本：Ubuntu 24.04
• Python环境：Python3.10+
• 数据库版本：PostgreSQL 16
• 科学上网
• 部署架构（开源）：Ollama+AnythingLLM+Weaviate
- • Ollama (LLM)：重点是生成响应，是基于 语言模型的推理，适合进行 创造性 或推理的任务。
- • Weaviate (向量数据库)：重点是检索相关信息，是基于 语义相似度 的搜索，适合用来查找 与查询相关的文档或数据。

系统环境准备

更新系统

更新系统# 更新系统
sudo apt -y update && sudo apt -y upgrade

修改本地时区

假设你想将时区设置为“Asia/Shanghai”，可以运行以下命令：

# 将时区设置为“Asia/Shanghai”
sudo timedatectl set-timezone Asia/Shanghai

修改主机名

# 执行以下命令后，必须重新连接才会显示主机名。
sudo hostnamectl hostname anythingllm.hbgslz.cn

安装日常常用的排错工具（可选）

日常运维经常会用到的命令，并非必须安装

# 用于日常运维
sudo apt-get -y install net-tools

关闭网卡的IPv6（可选）

• /etc/sysctl.conf：用于动态设置内核参数，禁用 IPv6 功能。
• /etc/netplan：用于管理网络接口的配置，确保网络接口不启用 IPv6 功能。
• /etc/default/grub（最后配置）：用于设置 GRUB 引导加载器参数，确保在系统启动时禁用 IPv6。

修改 `sysctl` 配置

编辑 /etc/sysctl.conf 文件并添加了以下内容：

# 向 /etc/sysctl.conf 文件并添加以下内容：
net.ipv6.conf.all.disable_ipv6=1
net.ipv6.conf.default.disable_ipv6=1
net.ipv6.conf.lo.disable_ipv6=1

确保 `sysctl` 这些设置立即生效

sudo sysctl -p

修改 `/etc/netplan` 配置文件

这个文件用于管理网络接口的配置，确保网络接口不启用 IPv6 功能。

编辑 Netplan 配置文件

sudo vim /etc/netplan/50-cloud-init.yaml

确保配置文件中包含以下内容

network:
  version: 2
  ethernets:
    enp0s1:
      dhcp4: false # 启用IPv4
      dhcp6: false # 禁止ipv6

应用更改

sudo netplan apply

修改 `/etc/default/grub` 文件（三个配置项目中，该配置必须在最后）

这个文件用于设置 GRUB 引导加载器的参数，确保在系统启动时禁用 IPv6。必须先处理上面的两个配置文件，最后才配置GRUB，否则会导致无法禁用ipv6。

编辑 `/etc/default/grub` 文件

sudo vim /etc/default/grub

添加如下禁止IPv6的配置

# 系统启动时禁用 IPv6
GRUB_CMDLINE_LINUX="ipv6.disable=1"

更新 GRUB 配置

sudo update-grub

重启系统

sudo reboot

验证 IPv6 是否禁用

# 检查是否存在ipv6的网络接口
ip -6 addr

如果没有显示任何 IPv6 地址，则表示 IPv6 已成功禁用。

安装Ollama（科学网络）

官方安装教程

• 官方自动安装教程：https://ollama.com/download/linux
• Linux的详细安装教程：https://github.com/ollama/ollama/blob/main/docs/linux.md

部署Ollama

安装Ollama

# 安装Ollama
sudo curl -fsSL https://ollama.com/install.sh | sh

配置以及启动Ollama服务

# 查看服务状态，默认ollama安装后自动启动，并配置了开机自动启动
sudo systemctl status ollama

校验Ollama是否安装成功

# 本地访问ollama
sudo curl -I http://127.0.0.1:11434

配置Ollama远程调用（可选）

查看Ollama服务的配置文件

# 查看服务状态，“/etc/systemd/system/ollama.service”即为服务的配置文件
sudo systemctl status ollama.service

编辑Ollama服务配置文件

# 通过上面的图片获取该文件路径
sudo vim /etc/systemd/system/ollama.service

添加OLLAMA_HOST配置参数

# Ollama监听地址
OLLAMA_HOST="0.0.0.0"

重启Ollama服务

# 重新加载服务配置
sudo systemctl daemon-reload

# 重启服务
sudo systemctl restart ollama.service

验证配置是否成功

# 本地访问ollama
sudo curl -I anythingllm.hbgslz.cn:11434

安装Ollama模型

模型选择

模型版本	模型大小(GB)	GPU显存(GB)	内存(GB)	硬盘容量(GB)
1.5B	1.1	4	8	5
7B	4.7	12	16	10
8B	4.9	16	32	15
14B	9	24	64	30
32B	20	48	128	60
70B	43	80	256	120
671B(MoE)	404	4x A100 GPUs（320GB VRAM）	512	500

模型安装(非科学上网环境下载更快)

安装教程：https://ollama.com/library/deepseek-r1

# 以1.5b安装为例，拉取并安装某个模型，“deepseek r1:1.5b”是模型名称，根据需要更改.
sudo ollama run deepseek-r1:1.5b

安装Docker环境（科学网络）

更新系统

sudo apt-get update
sudo apt-get upgrade -y

安装 Docker 的依赖

# 安装一些必要的工具，以便从仓库中下载 Docker 包
sudo apt-get -y install apt-transport-https ca-certificates curl software-properties-common

• apt-transport-https
- • 功能：apt-transport-https 允许 APT 使用 HTTPS 协议来获取软件包。这是为了保证与 Docker 官方仓库的通信安全，因为 Docker 的官方仓库地址是通过 HTTPS 提供的。
- • 用途：它确保 apt-get 能够通过安全的 HTTPS 协议访问 Docker 仓库，从而避免潜在的中间人攻击或者不安全的通信方式。
• ca-certificates
- • 功能：ca-certificates 是一组由受信任的证书颁发机构（CA）颁发的根证书。它们用于确保通过 HTTPS 协议连接到的服务器的身份是可信的。
- • 用途：安装 ca-certificates 包可以确保 apt-get 在通过 HTTPS 协议从 Docker 仓库获取包时，验证仓库服务器的 SSL 证书，从而避免 SSL/TLS 安全连接问题。
• curl
- • 功能：curl 是一个命令行工具，用于通过 URL 进行数据传输。它支持多种协议，包括 HTTP、HTTPS、FTP、SFTP 等。
- • 用途：在 Docker 的安装过程中，curl 用来从 Docker 官方网站下载 GPG 密钥，或者从 Docker 的官网仓库下载其他所需的资源。它可以处理 HTTP/HTTPS 请求并将内容输出到终端或者指定文件。
• software-properties-common
- • 功能：software-properties-common 包含了一个用来管理 APT 软件仓库的工具集，特别是用于添加、删除或者更新软件仓库的源。
- • 用途：software-properties-common 主要用于提供 add-apt-repository 命令，这个命令允许我们轻松地将第三方软件仓库添加到系统中。在 Docker 安装过程中，我们使用 add-apt-repository 来添加 Docker 官方的 APT 仓库，确保可以从官方仓库下载 Docker 包。

添加 Docker 仓库的 GPG 密钥

# 为了验证 Docker 包的完整性，需要添加 Docker 的 GPG 密钥
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo tee /etc/apt/trusted.gpg.d/docker.asc

添加 Docker 的 APT 仓库

# 添加 Docker 官方的 APT 仓库
sudo add-apt-repository "deb [arch=amd64] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable"

安装 Docker CE（社区版）

# 安装Docker 社区版
sudo apt-get -y install docker-ce docker-ce-cli containerd.io

• docker-ce
- • 用途：docker-ce 是 Docker 的社区版（Community Edition），它是 Docker 引擎的核心部分，提供了容器运行的基本功能。
- • 解释：这部分是 Docker 的主要组件，负责容器的创建、启动、停止、管理等。安装 docker-ce 会让你拥有 Docker 引擎来运行容器。
• docker-ce-cli
- • 用途：docker-ce-cli 是 Docker 的命令行工具，用于与 Docker 引擎进行交互。
- • 解释：你可以通过 docker 命令行工具（如 docker run，docker ps）来管理 Docker 容器、镜像、网络等。安装 docker-ce-cli 可以让你从命令行与 Docker 进行交互。
• containerd.io
- • 用途：containerd 是一个高效的容器运行时，提供容器的创建、调度、运行和监控等基本功能。
- • 解释：containerd 是 Docker 的一个底层组件，它是一个独立的容器运行时，用于管理容器的生命周期。安装 containerd.io 组件是为了确保 Docker 能够正确地调度和运行容器。

验证安装

# 查看docker版本
sudo docker --version

配置docker开机自动启动并启动Docker服务

# 配置docker开机自动启动
sudo systemctl enable docker

# 启动docker服务
sudo systemctl start docker

配置镜像加速器

针对Docker客户端版本大于 1.10.0 的用户

您可以通过修改daemon配置文件/etc/docker/daemon.json来使用加速器

# 创建镜像加速器目录
sudo mkdir -p /etc/docker

# 向/etc/docker/daemon.json文件中阿里云镜像加速器配置
sudo tee /etc/docker/daemon.json <<-'EOF'
{
  "registry-mirrors": ["https://ix2vi854.mirror.aliyuncs.com"]
}
EOF

# 重新加载服务
sudo systemctl daemon-reload

# 重启Docker服务
sudo systemctl restart docker

非 root 用户运行 Docker（可选）

默认情况下，Docker 需要以 root 用户身份运行。如果你希望以非 root 用户运行 Docker，可以将你的用户添加到 Docker 组

# 将当前的用户添加到Docker组
sudo usermod -aG docker $USER

向量数据库安装（任一）

Weaviate（为例部署）

Weaviate 是一个开源的、基于向量的数据库，专为存储、搜索和分析大规模的非结构化数据（如文本、图像、音频等）而设计。它提供了一种高效的方式来管理和查询包含丰富信息的多模态数据，并结合机器学习和自然语言处理技术，能支持智能化的搜索与数据分析。Weaviate 支持向量化数据存储，能够高效地执行基于相似度的检索（例如：语义搜索），因此在处理大规模知识库、推荐系统和自然语言处理（NLP）任务时非常有用。

Weaviate主要特点

向量数据库

• Weaviate 采用向量数据库的设计理念，可以将文本、图像等数据转换为向量表示，并存储在数据库中。通过这种方式，可以执行基于向量的相似度搜索，而不需要依赖传统的关键词匹配方法。
• 向量化数据使得语义搜索成为可能：例如，可以通过输入与查询意图相似的查询文本，获得相关的结果，即便这些结果与查询词汇并不完全匹配。

内置支持机器学习模型

• Weaviate 与多个流行的预训练机器学习模型集成，包括用于文本和图像的模型。它支持自动将数据（如文本、图像）转换为向量格式，从而能够在数据库中进行高效存储和搜索。
• 例如，Weaviate 内置了与 OpenAI 和 Hugging Face 等模型的集成，允许用户在数据库中存储由大规模语言模型（LLM）生成的嵌入向量，从而提升检索能力。

多模态支持

• Weaviate 支持处理多种不同类型的数据，包括文本、图像、音频等。无论是文本描述、图像内容还是音频文件，Weaviate 都能够对这些数据进行嵌入并存储为向量，便于跨模态查询和检索。
• 比如，用户可以使用图像描述查询相关的图片，或是用语音输入查询文本内容。

基于图的模型

• Weaviate 将数据存储在一个图数据库中，这意味着它不仅能存储实体及其向量表示，还能处理实体之间的关系。这对于构建知识图谱尤其有价值。
• 通过图的形式，可以更加高效地表示和查询数据的关系，例如实体之间的相似度、上下文关联等。

可扩展性与分布式支持

• Weaviate 设计上具备高可扩展性，能够在大规模数据集上运行，并支持水平扩展。通过分布式架构，Weaviate 能够处理更大的数据量，适应企业级应用需求。
• 它还支持容器化部署，可以通过 Docker 和 Kubernetes 部署，并且能够与云平台服务集成。

灵活的查询语言

• Weaviate 提供了一种名为 GraphQL 的查询语言，使得用户能够以声明式的方式进行复杂的数据检索。用户可以通过 GraphQL 查询接口获取存储在数据库中的向量数据和关联数据。
• 这种查询语言简洁且易于扩展，适合大规模数据操作，特别是在需要跨多个实体类型进行查询时。

开放源码与社区支持

• Weaviate 是一个完全开源的项目，所有代码都托管在 GitHub 上。这意味着用户可以自由地修改、扩展并根据需要进行定制。
• Weaviate 拥有活跃的开源社区，社区成员提供了大量的插件、工具和集成，支持不同的应用场景。

Weaviate应用场景

语义搜索与推荐系统

• 通过将数据转化为向量，Weaviate 可以为语义搜索提供支持。比如，你可以基于用户的历史查询或行为，推荐相关的文档、视频、图像等资源。语义搜索能够超越关键词匹配，理解语境和意图，提供更精准的结果。

知识图谱与推理

• Weaviate 支持构建动态的知识图谱，可以将数据之间的关系表示为图，并进行推理分析。这对于自动化决策支持系统、智能问答系统等应用非常有价值。

情感分析与情境理解

• 在NLP应用中，Weaviate可以处理与情感分析相关的任务，通过模型嵌入与相似度计算，可以识别文本中的情感倾向，并为相关应用提供反馈。

多模态搜索与分析

• Weaviate 支持图像和音频等非文本数据的搜索。你可以上传图像文件并基于图像内容进行检索，或使用语音输入进行搜索并返回文本数据。

大规模文本分析

• Weaviate 可以帮助企业或机构存储并分析大量的文档数据，应用于法律、医学、金融等领域，实现对文献或报告的深度分析和智能搜索。

Weaviate安装

创建数据存储目录

# postgresql数据存放目录
sudo mkdir -p /data/weaviate_data/weaviate_db

# web数据存放目录
sudo mkdir -p /data/weaviate_data/weaviate_web

# log数据存放目录
sudo mkdir -p /data/weaviate_data/weaviate_log

创建Docker网络

# 创建网络
sudo docker network create --driver bridge weaviate-network

# 删除网络
# sudo docker network rm weaviate-network

启动 PostgreSQL 容器（持久化存储）

sudo docker run -d \
  --name weaviate-db \
  --network weaviate-network \
  -p 5432:5432 \
  -e POSTGRES_DB=weaviate \
  -e POSTGRES_USER=weaviate \
  -e POSTGRES_PASSWORD=Hbgslz123. \
  -v /data/weaviate_data/weaviate_db:/var/lib/postgresql/data \
  --restart=always \
  --health-cmd="pg_isready -U weaviate" \
  --health-interval=30s \
  --health-timeout=10s \
  --health-retries=3 \
  postgres:16

参数详解：

• --restart=always: 确保容器在失败后会自动重启。
• --health-cmd: 设置健康检查命令，确保 PostgreSQL 容器健康运行。
• -v /data/weaviate_data/weaviate_db:/var/lib/postgresql/data: 使用本地路径来持久化数据库数据。
• --health-interval, --health-timeout, --health-retries: 设置健康检查的间隔时间、超时和重试次数，确保容器能够及时恢复。

启动weaviate-web容器

• 镜像地址：https://hub.docker.com/r/semitechnologies/weaviate/tags

# 启动weaviate容器
sudo docker run -d \
  --name weaviate-web \
  --network weaviate-network \
  -p 8080:8080 \
  -p 50051:50051 \
  -e QUERY_DEFAULTS_LIMIT=100 \
  -e WEAVIATE_THREAD_POOL_SIZE=8 \
  -e AUTHENTICATION_ANONYMOUS_ACCESS_ENABLED=false \
  -e PERSISTENCE_DATA_PATH=/var/lib/weaviate \
  -e WEAVIATE_DB_HOST=weaviate-db \
  -e WEAVIATE_DB_PORT=5432 \
  -e WEAVIATE_DB_USER=weaviate \
  -e WEAVIATE_DB_PASSWORD=Hbgslz123. \
  -e WEAVIATE_CLUSTER_MODE=false \
  -v /data/weaviate_data/weaviate_web:/var/lib/weaviate \
  -v /data/weaviate_data/weaviate_log:/var/log/weaviate \
  --restart=always \
  --memory=4g \
  --cpus=1 \
  semitechnologies/weaviate

参数详解：

• -e QUERY_DEFAULTS_LIMIT=100: 增加默认查询返回的最大结果数，适用于高负载环境。
• -e WEAVIATE_THREAD_POOL_SIZE=8: 设置 Weaviate 线程池的大小为 8，适合高并发请求。
• -e AUTHENTICATION_ANONYMOUS_ACCESS_ENABLED=false: 禁用匿名访问，确保只有授权用户才能访问。
• -e PERSISTENCE_DATA_PATH=/var/lib/weaviate: 定义数据存储路径。
• -v /data/weaviate_data/weaviate_web:/var/lib/weaviate: 将数据持久化到本地存储，避免容器停止后数据丢失。
• /data/weaviate_data/weaviate_log:/var/log/weaviate: 将日志文件持久化到本地，方便监控和排查问题。
• --memory=4g: 限制容器使用 4GB 的内存，防止资源耗尽。
• --cpus=1: 设置容器最大可用 CPU 核心数为 1，确保资源分配合理。
• --health-cmd: 配置容器健康检查，确保 Weaviate 容器正常运行。

验证容器间的连接

登录到 weaviate-web 容器

# 注意最后的“/bin/ash”，而不是“/bin/bash”
sudo docker exec -it weaviate-web /bin/ash

安装 `psql` 客户端

apk add postgresql-client

登录到 PostgreSQL 数据库

# 登录到 PostgreSQL 数据库
psql -h weaviate-db -U weaviate -d weaviate

Chroma

Chroma 是一个开源的向量数据库，专为高效存储和查询嵌入向量（embedding vectors）设计，支持通过向量相似度搜索快速查找相关数据。与 Weaviate 类似，Chroma 主要用于实现语义搜索、推荐系统和知识图谱的应用。Chroma 在设计上注重易用性和高效性，能够处理大规模的向量数据，并提供灵活的接口与强大的性能优化。

Chroma主要特点

向量存储与检索

• Chroma 通过将文本、图像等非结构化数据转换为向量嵌入并存储这些向量，支持基于相似度的检索。比如，Chroma 可以接收一个文本查询，查询结果不仅包括包含查询关键词的文本，还能包括语义上相关的文本，即使这些文本与查询词没有直接的词汇匹配。
• 通过这种方式，Chroma 能够有效地支持自然语言处理任务，尤其是当数据集较大时，基于向量的检索可以显著提高搜索质量和效率。

灵活的向量搜索引擎

• Chroma 提供多种相似度搜索算法，支持基于距离度量（如欧几里得距离、余弦相似度等）的高效向量检索。这使得它在执行语义搜索、图像检索或其他相似度度量任务时具有很高的性能。
• 支持批量操作，可以同时处理大量向量的存储和查询请求，适合大规模应用。

集成深度学习模型

• Chroma 允许与流行的深度学习框架（如 TensorFlow、PyTorch）以及预训练的模型（例如 GPT、BERT、CLIP 等）进行无缝集成。你可以使用这些模型将文本、图像或其他数据转化为向量，然后存储到数据库中。
• 它特别适用于处理基于大规模语言模型（LLM）的任务，如语义理解、推荐系统、问答系统等。

高性能与可扩展性

• Chroma 提供了优化的向量存储和检索算法，能够在大规模数据集上实现快速查询，适合大数据量应用。它通过高效的数据结构（如倒排索引、哈希表等）和并行化技术，提高了存储和查询的速度。
• 支持分布式部署，可以横向扩展，处理更大规模的数据集和查询请求，适合企业级的应用需求。

支持多种数据类型

• Chroma 支持存储多种类型的数据，如文本、图片、音频等，并为这些数据生成嵌入向量。比如，用户可以上传图像文件，使用图像嵌入模型将图像转化为向量并存储，之后基于图像向量进行查询。
• 这种多模态支持，使得 Chroma 能够在不同的应用场景中提供灵活的解决方案，支持图像-文本、音频-文本等跨模态搜索任务。

简单易用的 API 和集成

• Chroma 提供了简单易用的 Python API，支持快速集成和开发。其设计目标之一是简化开发者的工作，使得即便没有深厚的机器学习背景，也能方便地使用向量搜索功能。
• Chroma 还可以通过 RESTful API 与其他系统进行集成，方便与现有的应用架构进行协同工作。

开源与社区支持

• Chroma 是一个完全开源的项目，所有源代码都托管在 GitHub 上，开发者可以自由使用、修改和贡献代码。
• Chroma 的开源性质意味着它具有一个活跃的社区，社区成员提供了多种插件、工具和集成，帮助加速项目开发和应用推广。

Chroma主要应用场景

语义搜索

• Chroma 的最大应用场景之一是语义搜索。通过将文本数据转换为向量表示，它能够理解查询的语义，并返回与查询意图最相关的结果，而不仅仅是基于关键词的匹配。这对于文本检索、FAQ 系统、智能问答等非常有用。

图像与文本检索

• Chroma 可以用于图像和文本的跨模态检索。比如，用户上传一张图片，系统可以根据图片内容查询相关的文本或其他图片；或者用户输入一段文本，系统返回与文本描述相关的图片。

知识图谱与智能决策

• Chroma 可以帮助构建知识图谱，提供基于向量的相似度计算和推理能力。在智能决策系统中，Chroma 可用于存储和查询知识库，帮助系统做出更加智能的决策。

多模态数据分析

• Chroma 支持处理多种类型的数据，可以用来分析跨模态的数据。例如，通过分析文本和图像的关系，或者结合图像和音频数据，进行多维度的数据分析和处理。

AI 驱动的 NLP 任务

• Chroma 支持在自然语言处理任务中应用，如情感分析、命名实体识别、文档分类等。通过将文本数据转化为嵌入向量并进行聚类或相似度检索，Chroma 能够在各种 NLP 任务中提供支持。

Chroma安装

创建数据存储目录

# 创建数据存储目录
sudo mkdir -p /data/chromadb_data

启动容器

# 启动Chroma容器
sudo docker run -d \
  --name chromadb \
  -p 8000:8000 \
  -v /data/chromadb_data:/chroma/chroma \
  -e IS_PERSISTENT=TRUE \
  -e ANONYMIZED_TELEMETRY=TRUE \
  --restart unless-stopped \
  chromadb/chroma

Qdrant

Qdrant 是一个高效的、开源的向量数据库，专门为存储和检索嵌入向量（embedding vectors）而设计。它支持多种相似度搜索任务，包括语义搜索、推荐系统、图像检索等，尤其在处理大规模非结构化数据时表现优异。Qdrant 通过向量化存储和高效的相似度计算，帮助开发者构建更智能的搜索引擎和推荐系统。Qdrant 的设计不仅关注向量检索，还强调对大数据集的高效处理，具备良好的可扩展性和可用性，适用于构建企业级的应用和生产环境。

Qdrant主要特点

向量存储与高效检索

• Qdrant 采用向量存储技术，可以将文本、图像等非结构化数据转换为高维向量，并将这些向量存储在数据库中。用户可以通过基于相似度的查询方式，从大规模数据集中快速获取与查询相关的项，而无需依赖传统的关键词匹配方法。
• 支持多种距离度量（如欧几里得距离、余弦相似度等）来进行向量的相似度计算，满足不同的应用需求。

支持高维向量

• Qdrant 特别适合处理高维向量数据。许多 NLP 或计算机视觉模型输出的嵌入向量通常都是高维的，Qdrant 在这方面表现出色，能够高效地存储和查询这些高维向量。
• 高维向量存储和检索的效率是 Qdrant 的核心优势之一，支持大规模数据集的处理和快速响应。

高性能和低延迟

• Qdrant 使用先进的索引技术，如 HNSW（Hierarchical Navigable Small World）算法，来加速向量检索过程。该算法优化了高维数据的检索速度，大大提高了系统的响应速度，尤其在大规模数据集上表现优秀。
• Qdrant 优化了批量插入和查询操作，支持高吞吐量的数据处理和低延迟的查询响应，适合实时应用场景。

强大的灵活性与可扩展性

• Qdrant 支持水平扩展，可以通过增加节点来处理更大的数据集和更高的查询负载。它支持分布式架构，能够扩展到多个节点以提高数据存储和处理能力。
• Qdrant 支持多种部署方式，可以在云环境、裸机或容器化平台上部署，适应不同的基础架构需求。

集成机器学习与深度学习模型

• Qdrant 支持与流行的机器学习和深度学习框架（如 TensorFlow、PyTorch）集成，可以与预训练模型（例如 BERT、CLIP 等）结合使用，生成数据的嵌入向量并存储在 Qdrant 中。
• 这种集成能力使得 Qdrant 能够与现代 NLP 和计算机视觉应用无缝结合，广泛应用于语义搜索、图像检索等任务。

易用的 RESTful API 和客户端

• Qdrant 提供了简洁、直观的 RESTful API，开发者可以通过简单的 HTTP 请求来进行向量的插入、检索和删除操作。这使得 Qdrant 非常易于与其他应用和服务集成。
• 除了 REST API 外，Qdrant 还提供了官方的客户端库，支持多种编程语言（如 Python、Go、Java等），方便开发者在不同环境中使用。

过滤与多样的查询能力

• Qdrant 允许用户在查询时使用过滤条件，以便在检索相似度最高的向量时，进一步缩小范围。这在推荐系统、广告投放和个性化内容推荐中非常有用。
• Qdrant 支持丰富的查询类型，包括基于相似度的查询、范围查询、范围筛选等，用户可以灵活地指定查询需求。

开源与社区支持

• Qdrant 是一个开源项目，所有源代码托管在 GitHub 上。它享有活跃的开发社区，用户可以自由使用、修改和扩展其功能。
• 社区提供了丰富的文档、示例和支持，开发者可以轻松上手并在需要时寻求帮助。

Qdrant主要应用场景

语义搜索

• Qdrant 在语义搜索应用中表现尤为突出。通过将文本或其他数据转化为向量，Qdrant 能够基于语义相似度进行搜索，而不仅仅是基于关键词匹配。这使得它非常适合用于智能问答系统、FAQ 系统、文档检索等场景。

图像检索

• Qdrant 可以用于图像的向量化存储和检索。例如，通过使用预训练的图像嵌入模型（如 CLIP），可以将图像转化为向量并存储在 Qdrant 中，用户可以通过查询图像内容相似的向量来实现图像检索。

多模态数据分析

• Qdrant 支持多种类型的向量（文本、图像、音频等），因此可以用于处理跨模态的数据检索。例如，通过将图像和相关文本都转换为向量并存储在同一数据库中，可以实现基于图像描述的图像检索，或是跨模态查询。

自然语言处理（NLP）应用

• Qdrant 在 NLP 领域的应用非常广泛，可以用于情感分析、实体识别、文本分类等任务。通过将文本转化为向量进行处理，Qdrant 可以支持多种 NLP 任务中的数据存储和检索需求。

知识图谱与关系检索

• Qdrant 可用于构建和查询知识图谱。通过对实体和关系的嵌入向量化，Qdrant 可以帮助管理和查询复杂的知识库，从而为智能决策提供支持。

Qdrant安装

安装教程：https://qdrant.tech/documentation/guides/installation/

创建数据存储目录

# 创建数据存储目录
sudo mkdir -p /data/qdrant_data

启动容器

# 启动qdrant容器
sudo docker run -d \
  --name qdrantdb \
  --restart=always \
  -p 6333:6333 \
  -p 6334:6334 \
  -v /data/qdrant_data:/qdrant/storage/ \
  qdrant/qdrant

Vespa

Vespa 是一个开源的、面向大规模数据的搜索引擎和推荐引擎，旨在支持高效的全文搜索、推荐、数据分析和机器学习任务。它提供了强大的实时搜索、向量搜索和多模态查询能力，广泛应用于各种搜索引擎、推荐系统、广告投放、自然语言处理（NLP）和大数据分析等场景。Vespa 由雅虎（Yahoo）开发，并且是一个高性能、可扩展的系统，支持大规模数据集的实时处理和查询。

主要特点

全文搜索与排名

• Vespa 提供强大的文本搜索功能，支持传统的基于关键词的搜索，也支持更复杂的排名和过滤。它能够处理各种类型的文本数据，包括文档、网页、日志等，支持倒排索引、排序、分面过滤等功能。
• 支持精确的全文检索，能够对多个字段进行灵活的匹配和排名，适合构建高效的搜索引擎。

向量搜索

• Vespa 支持向量存储和基于向量的相似度搜索。它能够将文本、图像等数据转换为向量嵌入，并根据这些向量进行相似度检索。用户可以通过输入一个查询向量来找到与之语义最相似的结果。
• 这使得 Vespa 非常适用于基于语义的搜索任务，特别是在推荐系统、个性化广告和 NLP 等应用中。

高性能与低延迟

• Vespa 设计上专注于高性能，能够在大规模数据集上执行快速查询。它通过优化的索引结构、分布式架构以及并行化查询处理，能够以低延迟的方式处理海量数据。
• 支持分布式部署，能够横向扩展，适应大数据量的查询请求，确保系统在高并发、高吞吐量的环境下保持高效。

实时数据更新

• Vespa 支持实时数据索引和查询，适用于需要即时响应的应用场景。无论是文档更新、用户行为记录还是产品库存变动，Vespa 都能立即处理并更新索引，确保用户查询到的是最新的数据。
• 实时更新使得 Vespa 在动态内容推荐、广告投放、社交媒体分析等场景中尤为有效。

支持机器学习与模型集成

• Vespa 能够集成机器学习模型并在查询时使用。通过将机器学习模型（如深度学习、排名模型等）嵌入到搜索流程中，Vespa 可以为每个查询动态计算和优化排名。
• 例如，Vespa 可以根据用户的查询内容，结合用户历史行为、设备信息等多维度特征，通过机器学习模型调整搜索结果的顺序或推荐的内容。

多模态搜索和多字段支持

• 除了文本数据，Vespa 还支持处理和查询图像、音频、视频等多模态数据。它可以将不同类型的数据（如图像嵌入、文本描述等）转化为向量，并支持跨模态的搜索任务。
• 例如，用户可以上传一张图片，系统返回与该图片内容相关的文本、视频或其他图片。

灵活的查询语言

• Vespa 提供了丰富的查询语言，支持基于文本、向量、数值等不同类型数据的多样化查询。用户可以通过标准的 RESTful API 提交复杂的查询请求，也可以结合自定义评分函数来进行排名和过滤。
• 支持各种类型的查询操作，包括模糊搜索、范围查询、布尔查询等，以及结合多种数据类型的复杂查询。

集成与可扩展性

• Vespa 提供了易于集成的 API 和客户端库，支持与其他系统（如 Web 应用、推荐系统、数据库等）进行无缝对接。它具有高度的可扩展性，可以根据需要部署到多个节点，支持大规模分布式部署。
• 支持容器化部署，能够通过 Docker 和 Kubernetes 进行容器化管理和部署，适应云平台和容器化环境。

开源与社区支持

• Vespa 是一个开源项目，代码托管在 GitHub 上。它拥有活跃的开发社区，用户可以自由使用、修改和扩展其功能。社区成员提供了丰富的文档、示例和集成方案，帮助开发者快速上手并进行应用开发。

主要应用场景

搜索引擎

• Vespa 最基本的应用场景是作为一个高效的搜索引擎，适用于各种搜索任务，如网页搜索、文档搜索、产品搜索等。它不仅支持传统的基于关键词的全文搜索，还支持基于向量的语义搜索。

广告投放与个性化广告

• 在广告投放中，Vespa 可以根据用户的兴趣、行为和上下文信息，通过实时搜索和推荐算法提供个性化的广告内容。这对于广告定向、提高广告点击率和转化率至关重要。
• 通过向量搜索和机器学习模型，Vespa 能够分析用户的实时行为和意图，并在广告投放中做出更精确的调整。

图像和多模态检索

• Vespa 支持图像数据的嵌入向量存储和搜索，可以用于图像的相似性检索。比如，用户上传一张图像，系统能够返回与该图像内容相似的其他图像或相关文本。
• 同时，Vespa 也支持多模态数据（文本、图像、音频等）的检索，可以实现跨模态的查询任务，例如基于图像搜索相关的文本信息，或者基于文本描述搜索相关的图像。

自然语言处理（NLP）

• Vespa 支持与自然语言处理（NLP）模型的集成，可以用于情感分析、实体识别、文本分类等任务。通过将模型嵌入到 Vespa 中，NLP 任务的查询能够通过机器学习模型进行动态优化。
• 例如，在智能问答系统中，Vespa 可以通过向量搜索获取与用户查询相关的答案，并根据查询上下文进行优化。

大数据分析与实时数据处理

• Vespa 适合用于大数据分析和实时数据处理任务，能够在大量数据中进行高效的查询、分析和过滤。它支持实时更新数据并立即响应查询，适合需要实时数据处理的场景，如社交媒体分析、日志分析等。

Vespa安装

创建数据存储目录

# 创建数据存储目录
sudo mkdir -p /data/vespa_data

对存数据存储目录授权

# 对存数据存储目录授权
sudo chown -R 1000:1000 /data/vespa_data
sudo chmod -R 755 /data/vespa_data

启动容器

# 启动vespa容器
sudo docker run -d \
  --name vespadb \
  --restart=always \
  -p 8080:8080 \
  -v /data/vespa_data:/opt/vespa/var \
  vespaengine/vespa

部署AnythingLLM

官方教程：https://docs.anythingllm.com/installation-desktop/overview#docker-vs-desktop-version

版本对比

• 企业用户推荐Docker版本

Feature	Available on Desktop	Available on Docker
Multi-user support	❌	✅
Emeddable chat widgets	❌	✅
One-click install	✅	❌
Private documents	✅	✅
Connect to any vector database	✅	✅
Use any LLM	✅	✅
Built-in embedding provider	✅	✅
Built-in LLM provider	✅	❌
White-labeling	❌	✅
Chat logs	✅	✅
Agent support	✅	✅
Agent skills	✅	✅
Third-party data connectors	✅	✅
Password protection	❌	✅
Invite new users to instance	❌	✅
Text splitting configuration	✅	✅
Whisper model support	✅	✅
Full developer API	✅	✅
User management	❌	✅
Workspace access management	❌	✅
Website scraping	✅	✅

Docker版本的anythingllm安装

• 官方教程：https://docs.anythingllm.com/installation-docker/local-docker

# 设置存储位置
export STORAGE_LOCATION=$HOME/anythingllm

# 创建存储目录
mkdir -p "$STORAGE_LOCATION"

# 创建 .env 文件
touch "$STORAGE_LOCATION/.env"

# 授权
sudo chmod -R 777 "$STORAGE_LOCATION"

# 运行 Docker 容器
sudo docker run -d -p 3001:3001 \
--restart=always \
--name anythingllm \
--network weaviate-network \
--cap-add SYS_ADMIN \
-v "$STORAGE_LOCATION":/app/server/storage \
-v "$STORAGE_LOCATION/.env":/app/server/.env \
-e STORAGE_DIR="/app/server/storage" \
-e WEAVIATE_URL=http://weaviate-web:8080 \
mintplexlabs/anythingllm

总结

通过Ollama、AnythingLLM和Weaviate的有机结合，DeepSeek知识库架构不仅提升了知识管理的智能化水平，还有效优化了信息检索的速度和准确性。Ollama为架构提供了本地化、可定制的AI推理平台，AnythingLLM增强了自然语言理解与生成的能力，而Weaviate则以其强大的向量数据库特性为系统提供了高效的查询与数据存储支持。三者的结合，为打造一个高效、智能、精准的知识库提供了强有力的技术支持，也为未来更多智能化系统的开发提供了宝贵的经验与启示。

如何学习AI大模型？

大模型时代，火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业？”“谁的饭碗又将不保了？”等问题热议不断。

不如成为「掌握AI工具的技术人」，毕竟AI时代，谁先尝试，谁就能占得先机！

想正式转到一些新兴的 AI 行业，不仅需要系统的学习AI大模型。同时也要跟已有的技能结合，辅助编程提效，或上手实操应用，增加自己的职场竞争力。

但是LLM相关的内容很多，现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学，学习成本和门槛很高

那么我作为一名热心肠的互联网老兵，我意识到有很多经验和知识值得分享给大家，希望可以帮助到更多学习大模型的人！至于能学习到多少就看你的学习毅力和能力了。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

福利来袭CSDN大礼包：《2025最全AI大模型学习资源包》免费分享，安全可点

全套AGI大模型学习大纲+路线

AI大模型时代的学习之旅：从基础到前沿，掌握人工智能的核心技能！

640套AI大模型报告合集

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。

学会后的收获：
• 基于大模型全栈工程实现（前端、后端、产品经理、设计、数据分析等），通过这门课可获得不同能力；

• 能够利用大模型解决相关实际项目需求：大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。因此，掌握大模型应用开发技能，可以让程序员更好地应对实际项目需求；

• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能，学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力：大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。

福利来袭CSDN大礼包：《2025最全AI大模型学习资源包》免费分享，安全可点

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

作为普通人，入局大模型时代需要持续学习和实践，不断提高自己的技能和认知水平，同时也需要有责任感和伦理意识，为人工智能的健康发展贡献力量。

你可能感兴趣的:(AI大模型,深度学习,deepseek,RAG,ollama,AnythingLLM,知识库)

男士护肤品哪个牌子好？十大男士护肤品排行榜高省APP珊珊
很多男生意识到护肤的必要性，开始着手护肤，但不知道该选哪个男士护肤品品牌使用好。目前市面上很多男士护肤品品牌，可谓琳琅满目，让人眼花缭乱。男士挑选护肤品时，根据自己皮肤需求去正规渠道挑选合适的知名护肤品比较放心靠谱。高省APP，是2021年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入
《玉骨遥》：大司命为什么不杀朱颜？原因没那么简单 windy天意晚晴
《玉骨遥》里，朱颜就是时影的命劫之人。重明与时影早就知道，他们一直瞒着大司命，如今大司命也知道了真相。可是大司命却没有杀朱颜，而是给朱颜下了诛心咒，还说时影的命劫已经破了，真的如此吗？1、计划总是赶不上变化的大司命从目前剧情来说，大司命还不如时影，他信心十足的事情总会有纰漏。他不让时影见命劫之女，结果时影还是遇上了。他想让时影走火入魔，一心复仇，结果时影在朱颜的劝说下放下了仇恨。大司命让时影开山收
英伟达靠什么支撑起了4万亿？AI泡沫还能撑多久？
英伟达市值突破4万亿美元，既是AI算力需求爆发的直接体现，也暗含市场对未来的狂热预期。其支撑逻辑与潜在风险并存，而AI泡沫的可持续性则取决于技术、商业与地缘政治的复杂博弈。⚙️一、英伟达4万亿市值的核心支撑因素技术垄断与生态壁垒硬件优势：英伟达GPU在AI训练市场占有率超87%，H100芯片的FP16算力达1979TFLOPS，领先竞品3-5倍。CUDA生态：400万开发者构建的软件护城河，成为A
Spring进阶 - SpringMVC实现原理之DispatcherServlet处理请求的过程倾听铃的声后端 spring java mvc 开发语言分布式
前文我们有了IOC的源码基础以及SpringMVC的基础，我们便可以进一步深入理解SpringMVC主要实现原理，包含DispatcherServlet的初始化过程和DispatcherServlet处理请求的过程的源码解析。本文是第二篇：DispatcherServlet处理请求的过程的源码解析。@pdaiSpring进阶-SpringMVC实现原理之DispatcherServlet处理请求的
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
JVM 内存模型深度解析：原子性、可见性与有序性的实现练习时长两年半的程序员小胡 JVM 深度剖析：从面试考点到生产实践 jvm java 内存模型
在了解了JVM的基础架构和类加载机制后，我们需要进一步探索Java程序在多线程环境下的内存交互规则。JVM内存模型（JavaMemoryModel，JMM）定义了线程和主内存之间的抽象关系，它通过规范共享变量的访问方式，解决了多线程并发时的数据一致性问题。本文将从内存模型的核心目标出发，详解原子性、可见性、有序性的实现机制，以及volatile、synchronized等关键字在其中的作用。一、J
Flowable 实战落地核心：选型决策与坑点破解练习时长两年半的程序员小胡 Flowable 流程引擎实战指南低代码 BPMN 流程引擎 flowable 后端 java
在企业级流程引擎的落地过程中，选型的准确性和坑点的预见性直接决定项目成败。本文聚焦Flowable实战中最关键的“选型决策”与“常见坑点”，结合真实项目经验，提供可落地的解决方案。一、流程引擎选型：从业务本质出发1.1选型的三大核心维度企业在选择流程引擎时，需避免陷入“技术崇拜”，应回归业务本质。评估Flowable是否适用，可从三个维度判断：业务复杂度若流程涉及动态审批链（如按金额自动升级审批）
SpringMVC的执行流程
1、什么是MVCMVC是一种设计模式。MVC的原理图如下所示M-Model模型（完成业务逻辑：有javaBean构成，service+dao+entity）V-View视图（做界面的展示jsp，html……）C-Controller控制器（接收请求—>调用模型—>根据结果派发页面2、SpringMVC是什么SpringMVC是一个MVC的开源框架，SpringMVC=Struts2+Spring，
企业级区块链平台Hyperchain核心原理剖析 boyedu 区块链区块链企业级区块链平台 Hyperchain
Hyperchain作为国产自主可控的企业级联盟区块链平台，其核心原理围绕高性能共识、隐私保护、智能合约引擎及可扩展架构展开，通过多模块协同实现企业级区块链网络的高效部署与安全运行。以下从核心架构、关键技术、性能优化、安全机制、应用场景五个维度展开剖析：一、核心架构：分层解耦与模块化设计Hyperchain采用分层架构，将区块链功能解耦为独立模块，支持灵活组合与扩展：P2P网络层由验证节点（VP）
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
2025年SDK游戏盾终极解析：重新定义手游安全的“隐形护甲” 上海云盾商务经理杨杨游戏安全
副标题：从客户端加密到AI反外挂，拆解全链路防护如何重塑游戏攻防天平引言：当传统高防在手游战场“失效”2025年全球手游市场规模突破$2000亿，黑客单次攻击成本却降至$30——某SLG游戏因协议层CC攻击单日流失37%玩家，某开放世界游戏遭低频DDoS瘫痪6小时损失千万。传统高防IP的致命短板暴露无遗：无法识别伪造客户端流量、难防协议篡改、误杀率超15%。而集成于游戏终端的SDK游戏盾，正以“源
LVS+Keepalived实现高可用和负载均衡 2401_84412895 程序员 lvs 负载均衡运维
2、开启网卡子接口配置VIP[root@a~]#cd/etc/sysconfig/network-scripts/[root@anetwork-scripts]#cp-aifcfg-ens32ifcfg-ens32:0[root@anetwork-scripts]#catifcfg-ens32:0BOOTPROTO=staticDEVICE=ens32:0ONBOOT=yesIPADDR=10.1
今晚吃太饱了爱伤心的蚂蚁
今晚吃太饱了，两碗干饭，两碗肉汤，一碗牛奶银耳汤，感觉肚子都顶出来了，圆滚滚的！明早要早起，出发去小蚂蚁家！看着剩下的肉汤，倒掉多可惜，干掉了！看着小蚂蚁熬的银耳汤，倒掉多可惜，于是热了一下，顺便热袋牛奶倒进去，大娃喝点，小蚂蚁喝点，还剩下一大碗，继续干掉！吃的太饱，人也懒洋洋的，躺床上不想动，感受的肚子撑撑的感觉，好久没吃这么饱了！这一晚灌的都是汤汤水水的，天冷的晚上，半夜要睡不安稳咯！哈哈！小
你对待万事万物的态度行靜
昨晚爸爸把洒水壶灌满水，对我说：你也该去浇浇你阳台上的花咯。这么大的天气，几天没浇水都快死了。我才意识到自己容易突然间忽视一些事情。尤其是身旁的一些事，可能它们呆久了，反而习以为常。想想每天的生活状态就是在不断的重复着一些事，有点固定模式。没有什么特别发生。记录我的一天：上班，挤公交，用手机或电脑，吃饭，上课。没有
CodeFoeces-450B ss5smi
题目原题链接：B.JzzhuandSequences题意根据公式公式计算对应fn的值。参考了其他作者的代码和思路。找循环点。负数取余需要加取余数到>0为止才可取余。代码#includeusingnamespacestd;constintmod=1e9+7;intmain(){longlongf[10],x,y,n;cin>>x>>y>>n;x=(x+mod)%mod;y=(y+mod)%mod;f
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
【异常】使用 LiteFlow 框架时，提示错误ChainDuplicateException: [chain name duplicate] chainName=categoryChallenge 本本本添哥 002 -进阶开发能力 java
一、报错内容Causedby:com.yomahub.liteflow.exception.ChainDuplicateException:[chainnameduplicate]chainName=categoryChallengeatcom.yomahub.liteflow.parser.helper.ParserHelper.lambda$null$0(ParserHelper.java:1
承德十大亲子鉴定医院名单(附2024年10所正规医院) 国医基因陈主任
承德哪家医院可以做亲子鉴定？承德市中心医院、中国人民解放军第二六六医院、承德医学院附属医院等都可以做常规亲子鉴定采样采集，一般的医院并不可以为你提供常规亲子鉴定检测的服务。承德亲子鉴定中心地址：承德市西大街路北11号（承德国医基因）。一般只有少数三甲医院可以做亲子鉴定采样，或者当地亲子鉴定中心可以做亲子鉴定。如果想做亲子鉴定，最好直接到亲子鉴定中心内或亲子鉴定医院采样点内进行双方抽血鉴定，这样会更
践行8.0~第六周11.25-12.02 初队长
突破后的喜悦最可怕的不是自己不清楚，而是自己清楚了，却依然不心动，我想这就是我们每个人的惰性存在，在这一周的践行，我发现自己依然是停留在自己的模式当中，不断的恶性的轮回，虽然的话，那再晨间日记方面是纸质的填写，但是对一天的工作没有起到应有的计划和推动的作用而我自己呢，也有些时候的话会处于一个相对来讲放松的一个状态，时间的把控的话也有一些点的消极，所以在这周的间隙，重点是关注自己的三大目标为目标来进
5G基站信号加速器！AD8021ARZ-REEL7亚德诺超低噪声高速电压放大器专利失真消除技术! 深圳市尚想信息技术有限公司 5G通信高速运放 ADI黑科技 8K视频医疗超声
AD8021ARZ-REEL7ADI：重新定义高速放大器的性能极限！一、产品简介AD8021ARZ-REEL7是ADI（亚德诺半导体）推出的超低噪声高速电压反馈放大器，采用XFCB工艺和专利失真消除技术，专为4K/8K视频处理、医疗成像、5G通信等超高频应用设计。以1.8GHz带宽和0.1nV/√Hz超低噪声，成为高速信号调理的终极解决方案！二、五大颠覆性优势军工级信号保真度1.8GHz-3dB带
打造自己的梦想生态系统轻风style
今天听了第5周5.1的梦想系统和随堂练习：梦想仓库与八大关注表。参照老师给出的例子，列出了八大关注对应的自己的梦想。有些写的时候内心都在怀疑，但因为老师有说到，要没有分别心的去列出，不管是近的，远的，小的，大的，自己觉得可以实现的，或者觉得根本不可能实现的，都统统的列出来。就像音频中提到的，林语堂说过的话，梦想无论怎样模糊，总潜伏在我们心底，使我们的心境永远得不到宁静，直到这些梦想成为事实才止；像
我是孩子妈妈，我会让孩子饿着吗？松玲子
回老家过年，就是一场在关于喂养孩子问题上与老人的巅峰对决。前天我们回老家了，他爷爷奶奶就说孩子瘦了，就说我喂的不好，不按时喂，第一天夜里孩子总是睡一会就哭，睡一会就哭，夜里不知醒了多少次，弄得我真是几乎彻夜未眠。一大早，我还没起，我就听见他爷爷奶奶在外边说，今黑夜阳阳怎么老哭，是不是饿的，然后又延伸到我喂养的问题上，说不吃盐不行，不吃盐孩子没劲，吃蛋光吃个蛋黄，吃不饱，给他吃全蛋就行，哎呀我去，我
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
心力践行营十二期一阶学习打卡 LX_王彤彤
姓名：王彤彤时间：2021年4月24日一：朗读师父的十大人生哲学二：师父的早安分享感悟很喜欢这句话：所有的行动都是基于目标的尝试，没有所谓的失败，只是不同尝试后得到的不同结果，让我们更好地调整下一次的行动。三：感恩日记1.我太幸福了，我很感恩姑姑，因为姑姑放假又投喂了我，还给我带了饺子回家，这让我感觉很幸福。谢谢，谢谢，谢谢。2.我太幸福了，我很感恩师父晚上的直播，因为听他的分享我知道怎么更好的去
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
京东中秋节会打折吗？京东中秋节活动力度大吗？高省APP珊珊
京东中秋节会打折，并且活动力度通常是比较大的。以下是具体分析：京东中秋节打折情况降价促销：京东在中秋节期间会推出大规模的降价促销活动，涵盖食品、家居、家电等多个品类，以及众多热门品牌。消费者可以在此期间享受到实实在在的降价优惠。多种优惠形式：除了直接的降价促销，京东还会通过满减优惠、折扣促销、限时秒杀等多种形式的优惠活动来吸引消费者。这些优惠活动通常具有较高的吸引力，能够激发消费者的购买欲望。目前
Android 应用权限管理详解
文章目录1.权限类型2.权限请求机制3.权限组和分级4.权限管理的演进5.权限监控和SELinux强制访问控制6.应用权限审核和GooglePlayProtect7.开发者最佳实践8.用户权限管理9.Android应用沙箱模型10.ScopedStorage（分区存储）11.背景位置权限（BackgroundLocationAccess）12.权限回收和自动清理13.权限请求的用户体验设计14.G
AI模型训练中过拟合和欠拟合的区别是什么？ workflower 人工智能算法人工智能数据分析
在AI模型训练中，过拟合和欠拟合是两种常见的模型性能问题，核心区别在于模型对数据的学习程度和泛化能力：欠拟合（Underfitting）-定义：模型未能充分学习到数据中的规律，对训练数据的拟合程度较差，在训练集和测试集上的表现都不好（如准确率低、损失值高）。-原因：-模型结构过于简单（如用线性模型解决非线性问题）；-训练数据量不足或特征信息不充分；-训练时间太短，模型尚未学到有效模式。-表现：训练
农场种蔬菜赚钱小游戏有哪些五大可以赚钱的小游戏APP 氧惠帮朋友一起省
喜欢种菜吗？我特意带来农场种蔬菜赚钱小游戏排行榜2022，线上汇集了超多模拟种菜玩法，玩家可以免费种植赚钱哦！每天都有大量的种植任务，线上完成就能赚钱哦！快来下载吧！1.氧惠APP购物、看电影、点外卖、用氧惠APP！更优惠！氧惠（全网优惠上氧惠）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面，送1:1超级补贴(邀请好友自购多少，你就推广得多少，非常厉害)，欢迎各位
JVM StackMapTable 属性的作用及理解 lijingyao8206 jvm 字节码 Class文件 StackMapTable
在Java 6版本之后JVM引入了栈图(Stack Map Table)概念。为了提高验证过程的效率，在字节码规范中添加了Stack Map Table属性，以下简称栈图，其方法的code属性中存储了局部变量和操作数的类型验证以及字节码的偏移量。也就是一个method需要且仅对应一个Stack Map Table。在Java 7版
回调函数调用方法百合不是茶 java
最近在看大神写的代码时,.发现其中使用了很多的回调 ,以前只是在学习的时候经常用到 ,现在写个笔记记录一下代码很简单: MainDemo :调用方法得到方法的返回结果
[时间机器]制造时间机器需要一些材料 comsci 制造
根据我的计算和推测,要完全实现制造一台时间机器,需要某些我们这个世界不存在的物质和材料... 甚至可以这样说,这种材料和物质,我们在反应堆中也无法获得......
开口埋怨不如闭口做事邓集海邓集海做人做事工作
“开口埋怨，不如闭口做事。”不是名人名言，而是一个普通父亲对儿子的训导。但是，因为这句训导，这位普通父亲却造就了一个名人儿子。这位普通父亲造就的名人儿子，叫张明正。　　　　张明正出身贫寒，读书时成绩差，常挨老师批评。高中毕业，张明正连普通大学的分数线都没上。高考成绩出来后，平时开口怨这怨那的张明正，不从自身找原因，而是不停地埋怨自己家庭条件不好、埋怨父母没有给他创造良好的学习环境。　　　　
jQuery插件开发全解析，类级别与对象级别开发 IT独行者 jquery 开发插件　函数
jQuery插件的开发包括两种：一种是类级别的插件开发，即给 jQuery添加新的全局函数，相当于给 jQuery类本身添加方法。 jQuery的全局函数就是属于 jQuery命名空间的函数，另一种是对象级别的插件开发，即给 jQuery对象添加方法。下面就两种函数的开发做详细的说明。 1 、类级别的插件开发类级别的插件开发最直接的理解就是给jQuer
Rome解析Rss 413277409 Rome解析Rss
import java.net.URL; import java.util.List; import org.junit.Test; import com.sun.syndication.feed.synd.SyndCategory; import com.sun.syndication.feed.synd.S
RSA加密解密无量加密解密 rsa
RSA加密解密代码代码有待整理 package com.tongbanjie.commons.util; import java.security.Key; import java.security.KeyFactory; import java.security.KeyPair; import java.security.KeyPairGenerat
linux 软件安装遇到的问题 aichenglong linux 遇到的问题 ftp
1 ftp配置中遇到的问题 500 OOPS: cannot change directory 出现该问题的原因:是SELinux安装机制的问题.只要disable SELinux就可以了修改方法:1 修改/etc/selinux/config 中SELINUX=disabled 2 source /etc
面试心得 alafqq 面试
最近面试了好几家公司。记录下；支付宝，面试我的人胖胖的，看着人挺好的；博彦外包的职位，面试失败；阿里金融，面试官人也挺和善，只不过我让他吐血了。。。由于印象比较深，记录下； 1，自我介绍 2，说下八种基本类型；（算上string。楼主才答了3种，哈哈，string其实不是基本类型，是引用类型） 3，什么是包装类，包装类的优点； 4，平时看过什么书？NND，什么书都没看过。。照样
java的多态性探讨百合不是茶 java
java的多态性是指main方法在调用属性的时候类可以对这一属性做出反应的情况 //package 1; class A{ public void test(){ System.out.println("A"); } } class D extends A{ public void test(){ S
网络编程基础篇之JavaScript-学习笔记 bijian1013 JavaScript
1.documentWrite <html> <head> <script language="JavaScript"> document.write("这是电脑网络学校"); document.close(); </script> </h
探索JUnit4扩展：深入Rule bijian1013 JUnit Rule 单元测试
本文将进一步探究Rule的应用，展示如何使用Rule来替代@BeforeClass，@AfterClass，@Before和@After的功能。在上一篇中提到，可以使用Rule替代现有的大部分Runner扩展，而且也不提倡对Runner中的withBefores()，withAfte
[CSS]CSS浮动十五条规则 bit1129 css
这些浮动规则，主要是参考CSS权威指南关于浮动规则的总结，然后添加一些简单的例子以验证和理解这些规则。 1. 所有的页面元素都可以浮动 2. 一个元素浮动后，会成为块级元素，比如<span>,a, strong等都会变成块级元素 3.一个元素左浮动，会向最近的块级父元素的左上角移动，直到浮动元素的左外边界碰到块级父元素的左内边界；如果这个块级父元素已经有浮动元素停靠了
【Kafka六】Kafka Producer和Consumer多Broker、多Partition场景 bit1129 partition
0.Kafka服务器配置 3个broker 1个topic，6个partition，副本因子是2 2个consumer，每个consumer三个线程并发读取 1. Producer package kafka.examples.multibrokers.producers; import java.util.Properties; import java.util.
zabbix_agentd.conf配置文件详解 ronin47 zabbix 配置文件
Aliaskey的别名，例如 Alias=ttlsa.userid:vfs.file.regexp[/etc/passwd,^ttlsa:.:([0-9]+),,,,\1]，或者ttlsa的用户ID。你可以使用key：vfs.file.regexp[/etc/passwd,^ttlsa:.: ([0-9]+),,,,\1]，也可以使用ttlsa.userid。备注: 别名不能重复，但是可以有多个
java--19.用矩阵求Fibonacci数列的第N项 bylijinnan fibonacci
参考了网上的思路，写了个Java版的： public class Fibonacci { final static int[] A={1,1,1,0}; public static void main(String[] args) { int n=7; for(int i=0;i<=n;i++){ int f=fibonac
Netty源码学习-LengthFieldBasedFrameDecoder bylijinnan java netty
先看看LengthFieldBasedFrameDecoder的官方API http://docs.jboss.org/netty/3.1/api/org/jboss/netty/handler/codec/frame/LengthFieldBasedFrameDecoder.html API举例说明了LengthFieldBasedFrameDecoder的解析机制，如下：实
AES加密解密 chicony 加密解密
AES加解密算法，使用Base64做转码以及辅助加密： package com.wintv.common; import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; import javax.crypto.spec.SecretKeySpec; import sun.misc.BASE64Decod
文件编码格式转换 ctrain 编码格式
package com.test; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream;
mysql 在linux客户端插入数据中文乱码 daizj mysql 中文乱码
1、查看系统客户端，数据库，连接层的编码查看方法： http://daizj.iteye.com/blog/2174993 进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+------
好代码是廉价的代码 dcj3sjt126com 程序员读书
长久以来我一直主张：好代码是廉价的代码。当我跟做开发的同事说出这话时，他们的第一反应是一种惊愕，然后是将近一个星期的嘲笑，把它当作一个笑话来讲。当他们走近看我的表情、知道我是认真的时，才收敛一点。当最初的惊愕消退后，他们会用一些这样的话来反驳： “好代码不廉价，好代码是采用经过数十年计算机科学研究和积累得出的最佳实践设计模式和方法论建立起来的精心制作的程序代码。” 我只
Android网络请求库——android-async-http dcj3sjt126com android
在iOS开发中有大名鼎鼎的ASIHttpRequest库，用来处理网络请求操作，今天要介绍的是一个在Android上同样强大的网络请求库android-async-http，目前非常火的应用Instagram和Pinterest的Android版就是用的这个网络请求库。这个网络请求库是基于Apache HttpClient库之上的一个异步网络请求处理库，网络处理均基于Android的非UI线程，通
ORACLE 复习笔记之SQL语句的优化 eksliang SQL优化 Oracle sql语句优化 SQL语句的优化
转载请出自出处：http://eksliang.iteye.com/blog/2097999 SQL语句的优化总结如下 sql语句的优化可以按照如下六个步骤进行：合理使用索引避免或者简化排序消除对大表的扫描避免复杂的通配符匹配调整子查询的性能 EXISTS和IN运算符下面我就按照上面这六个步骤分别进行总结：
浅析：Android 嵌套滑动机制（NestedScrolling） gg163 android 移动开发滑动机制嵌套
谷歌在发布安卓 Lollipop版本之后，为了更好的用户体验，Google为Android的滑动机制提供了NestedScrolling特性 NestedScrolling的特性可以体现在哪里呢？ 比如你使用了Toolbar，下面一个ScrollView，向上滚
使用hovertree菜单作为后台导航 hvt JavaScript jquery .net hovertree asp.net
hovertree是一个jquery菜单插件，官方网址：http://keleyi.com/jq/hovertree/ ，可以登录该网址体验效果。 0.1.3版本：http://keleyi.com/jq/hovertree/demo/demo.0.1.3.htm hovertree插件包含文件： http://keleyi.com/jq/hovertree/css
SVG 教程（二）矩形天梯梦 svg
SVG <rect> SVG Shapes SVG有一些预定义的形状元素，可被开发者使用和操作：矩形 <rect> 圆形 <circle> 椭圆 <ellipse> 线 <line> 折线 <polyline> 多边形 <polygon> 路径 <path>
一个简单的队列 luyulong java 数据结构队列
public class MyQueue { private long[] arr; private int front; private int end; // 有效数据的大小 private int elements; public MyQueue() { arr = new long[10]; elements = 0; front
基础数据结构和算法九：Binary Search Tree sunwinner Algorithm
A binary search tree (BST) is a binary tree where each node has a Comparable key (and an associated value) and satisfies the restriction that the key in any node is larger than the keys in all
项目出现的一些问题和体会 Steven-Walker DAO Web servlet
第一篇博客不知道要写点什么，就先来点近阶段的感悟吧。这几天学了servlet和数据库等知识，就参照老方的视频写了一个简单的增删改查的，完成了最简单的一些功能，使用了三层架构。 dao层完成的是对数据库具体的功能实现，service层调用了dao层的实现方法，具体对servlet提供支持。 &
高手问答：Java老A带你全面提升Java单兵作战能力！ ITeye管理员 java
本期特邀《Java特种兵》作者：谢宇，CSDN论坛ID: xieyuooo 针对JAVA问题给予大家解答，欢迎网友积极提问，与专家一起讨论! 作者简介：淘宝网资深Java工程师，CSDN超人气博主，人称“胖哥”。 CSDN博客地址： http://blog.csdn.net/xieyuooo 作者在进入大学前是一个不折不扣的计算机白痴，曾经被人笑话过不懂鼠标是什么，

Ollama + AnythingLLM +Weaviate 架构搭建 DeepSeek 知识库

前言

系统环境

系统环境准备

更新系统

修改本地时区

修改主机名

安装日常常用的排错工具（可选）

关闭网卡的IPv6（可选）

修改 sysctl 配置

编辑 /etc/sysctl.conf 文件并添加了以下内容：

确保 sysctl 这些设置立即生效

修改 /etc/netplan 配置文件

编辑 Netplan 配置文件

确保配置文件中包含以下内容

应用更改

修改 /etc/default/grub 文件（三个配置项目中，该配置必须在最后）

编辑 /etc/default/grub 文件

添加如下禁止IPv6的配置

更新 GRUB 配置

重启系统

验证 IPv6 是否禁用

安装Ollama（科学网络）

官方安装教程

部署Ollama

安装Ollama

配置以及启动Ollama服务

校验Ollama是否安装成功

配置Ollama远程调用（可选）

查看Ollama服务的配置文件

编辑Ollama服务配置文件

添加OLLAMA_HOST配置参数

重启Ollama服务

验证配置是否成功

安装Ollama模型

模型选择

模型安装(非科学上网环境下载更快)

安装Docker环境（科学网络）

更新系统

安装 Docker 的依赖

添加 Docker 仓库的 GPG 密钥

添加 Docker 的 APT 仓库

安装 Docker CE（社区版）

验证安装

配置docker开机自动启动并启动Docker服务

配置镜像加速器

非 root 用户运行 Docker（可选）

向量数据库安装（任一）

Weaviate（为例部署）

Weaviate主要特点

向量数据库

内置支持机器学习模型

多模态支持

基于图的模型

可扩展性与分布式支持

灵活的查询语言

开放源码与社区支持

Weaviate应用场景

语义搜索与推荐系统

知识图谱与推理

情感分析与情境理解

多模态搜索与分析

大规模文本分析

Weaviate安装

创建数据存储目录

创建Docker网络

启动 PostgreSQL 容器（持久化存储）

启动weaviate-web容器

验证容器间的连接

登录到 weaviate-web 容器

安装 psql 客户端

登录到 PostgreSQL 数据库

Chroma

Chroma主要特点

向量存储与检索

灵活的向量搜索引擎

集成深度学习模型

高性能与可扩展性

支持多种数据类型

简单易用的 API 和集成

修改 `sysctl` 配置

确保 `sysctl` 这些设置立即生效

修改 `/etc/netplan` 配置文件

修改 `/etc/default/grub` 文件（三个配置项目中，该配置必须在最后）

编辑 `/etc/default/grub` 文件

安装 `psql` 客户端