weixin_37763484

【RAG排序】rag排序代码示例-简单版

claude生成的一个排序的例子，有几种简单的方法。

示例数据

查询：“人工智能在医疗领域的应用前景如何？”
文档库：8个相关文档，涵盖AI在医疗、金融、教育、自动驾驶等领域的应用

实现的排序方法

SimpleBM25Ranker - 中文BM25排序器

使用jieba进行中文分词
计算TF-IDF和文档长度归一化
处理中文停用词

ChineseKeywordRanker - 关键词匹配排序器

Jaccard相似度 + 查询词覆盖率
简化的TF权重计算

ChineseSentenceTransformerRanker - 语义相似度排序器

使用中文预训练模型 text2vec-base-chinese
备用多语言模型支持

ChineseEnsembleRanker - 集成排序器

多排序器加权融合
分数归一化处理

使用方法

# 1. 安装依赖
pip install sentence-transformers jieba scikit-learn pandas torch

# 2. 运行示例
python rag_ranking_example.py

完整代码

# RAG排序完整中文示例与使用流程
import numpy as np
import torch
import torch.nn.functional as F
from sklearn.metrics.pairwise import cosine_similarity
from sentence_transformers import SentenceTransformer
import jieba
from collections import Counter
import math
import pandas as pd

# 示例数据：查询和候选文档
SAMPLE_QUERY = "人工智能在医疗领域的应用前景如何？"

SAMPLE_DOCUMENTS = [
    "人工智能在医疗诊断中发挥着越来越重要的作用。通过深度学习算法，AI系统能够分析医学影像，如X光片、CT扫描和MRI图像，帮助医生更准确地识别疾病。例如，AI在肺癌早期筛查、眼底病变检测等方面已经展现出超越人类专家的准确率。",
    
    "机器学习技术在金融风控领域应用广泛。银行和金融机构利用大数据分析和机器学习算法来评估信贷风险、检测欺诈交易、优化投资组合。这些技术能够处理海量的交易数据，识别异常模式，为金融决策提供科学依据。",
    
    "医疗人工智能的发展正在革命性地改变传统医疗模式。智能诊断系统不仅能够提高诊断准确性，还能大幅缩短诊断时间。在药物研发方面，AI技术能够加速新药发现过程，预测药物分子的特性和副作用，降低研发成本和时间。",
    
    "自动驾驶技术是人工智能应用的重要方向之一。通过计算机视觉、深度学习和传感器融合技术，自动驾驶汽车能够实时感知道路环境、识别交通标志、避障和路径规划。目前主要汽车厂商都在加大对自动驾驶技术的投入。",
    
    "智慧医疗系统整合了物联网、大数据、云计算和人工智能等先进技术。患者可以通过智能穿戴设备实时监测健康状况，医生可以远程诊断和治疗，医院管理也更加智能化。这种新型医疗模式提高了医疗服务效率，降低了医疗成本。",
    
    "教育技术的发展让个性化学习成为可能。AI驱动的在线教育平台能够根据学生的学习进度和能力水平，提供定制化的学习内容和路径。自适应学习系统通过分析学习数据，优化教学策略，提高学习效果。",
    
    "临床决策支持系统利用人工智能技术辅助医生做出更好的诊疗决策。这些系统能够整合患者的病史、检查结果、药物信息等多源数据，提供循证医学建议。AI还能够预测疾病发展趋势，帮助制定个性化治疗方案。",
    
    "区块链技术在供应链管理中展现出巨大潜力。通过分布式账本技术，企业可以实现供应链的透明化和可追溯性。这对于食品安全、药品监管等领域特别重要，消费者可以清楚了解产品的来源和流通过程。"
]

class ChineseTextProcessor:
    """中文文本处理工具类"""
    
    def __init__(self):
        # 初始化停用词列表
        self.stop_words = set([
            '的', '了', '在', '是', '我', '有', '和', '就', '不', '人', '都', '一', '一个',
            '上', '也', '很', '到', '说', '要', '去', '你', '会', '着', '没有', '看', '好',
            '自己', '这', '能', '那', '来', '用', '把', '让', '更', '为', '可以', '等',
            '中', '通过', '对', '及', '与', '以', '或', '但', '而', '由于', '因为'
        ])
    
    def tokenize(self, text):
        """中文分词"""
        words = jieba.lcut(text)
        return [word for word in words if word not in self.stop_words and len(word) > 1]
    
    def extract_keywords(self, text, top_k=10):
        """提取关键词"""
        words = self.tokenize(text)
        word_freq = Counter(words)
        return dict(word_freq.most_common(top_k))

class SimpleBM25Ranker:
    """简化版BM25排序器（适用于中文）"""
    
    def __init__(self, k1=1.2, b=0.75):
        self.k1 = k1
        self.b = b
        self.processor = ChineseTextProcessor()
        self.corpus_tokens = []
        self.doc_freqs = {}
        self.avg_doc_length = 0
        
    def fit(self, documents):
        """训练BM25模型"""
        self.corpus_tokens = []
        word_doc_count = {}
        total_length = 0
        
        for doc in documents:
            tokens = self.processor.tokenize(doc)
            self.corpus_tokens.append(tokens)
            total_length += len(tokens)
            
            # 计算词文档频率
            unique_words = set(tokens)
            for word in unique_words:
                word_doc_count[word] = word_doc_count.get(word, 0) + 1
        
        # 计算平均文档长度
        self.avg_doc_length = total_length / len(documents)
        
        # 计算IDF
        corpus_size = len(documents)
        for word, doc_count in word_doc_count.items():
            self.doc_freqs[word] = math.log((corpus_size - doc_count + 0.5) / (doc_count + 0.5))
    
    def score(self, query, doc_tokens):
        """计算BM25分数"""
        query_tokens = self.processor.tokenize(query)
        doc_length = len(doc_tokens)
        score = 0
        
        word_count = Counter(doc_tokens)
        
        for word in query_tokens:
            if word in word_count:
                tf = word_count[word]
                idf = self.doc_freqs.get(word, 0)
                
                score += idf * (tf * (self.k1 + 1)) / (
                    tf + self.k1 * (1 - self.b + self.b * (doc_length / self.avg_doc_length))
                )
        
        return score
    
    def rank_documents(self, query, documents, top_k=10):
        """使用BM25对文档排序"""
        if not self.corpus_tokens:
            self.fit(documents)
        
        scores = []
        for i, doc in enumerate(documents):
            doc_tokens = self.corpus_tokens[i] if i < len(self.corpus_tokens) else self.processor.tokenize(doc)
            score = self.score(query, doc_tokens)
            scores.append((doc, score, i))
        
        # 排序
        scores.sort(key=lambda x: x[1], reverse=True)
        
        return [
            {
                'document': doc,
                'bm25_score': score,
                'original_index': idx,
                'rank': i + 1
            }
            for i, (doc, score, idx) in enumerate(scores[:top_k])
        ]

class ChineseSentenceTransformerRanker:
    """基于中文语义模型的排序器"""
    
    def __init__(self, model_name="shibing624/text2vec-base-chinese"):
        try:
            self.model = SentenceTransformer(model_name)
            print(f"成功加载模型: {model_name}")
        except Exception as e:
            print(f"模型加载失败，使用备用模型: {e}")
            # 备用模型
            self.model = SentenceTransformer("paraphrase-multilingual-MiniLM-L12-v2")
    
    def rank_documents(self, query, documents, top_k=10):
        """使用语义相似度排序"""
        print("正在计算文档嵌入...")
        
        # 编码查询和文档
        query_embedding = self.model.encode([query])
        doc_embeddings = self.model.encode(documents, show_progress_bar=True)
        
        # 计算相似度
        similarities = cosine_similarity(query_embedding, doc_embeddings)[0]
        
        # 排序
        scored_docs = list(zip(documents, similarities, range(len(documents))))
        scored_docs.sort(key=lambda x: x[1], reverse=True)
        
        return [
            {
                'document': doc,
                'semantic_score': score,
                'original_index': idx,
                'rank': i + 1
            }
            for i, (doc, score, idx) in enumerate(scored_docs[:top_k])
        ]

class ChineseKeywordRanker:
    """基于关键词匹配的排序器"""
    
    def __init__(self):
        self.processor = ChineseTextProcessor()
    
    def calculate_keyword_score(self, query, document):
        """计算关键词匹配分数"""
        query_words = set(self.processor.tokenize(query))
        doc_words = set(self.processor.tokenize(document))
        
        if not query_words:
            return 0
        
        intersection = query_words.intersection(doc_words)
        
        # Jaccard相似度
        jaccard = len(intersection) / len(query_words.union(doc_words))
        
        # 查询词覆盖率
        coverage = len(intersection) / len(query_words)
        
        # TF-IDF权重（简化版）
        tf_score = sum([document.count(word) for word in intersection])
        
        return 0.4 * jaccard + 0.4 * coverage + 0.2 * (tf_score / len(document.split()))
    
    def rank_documents(self, query, documents, top_k=10):
        """使用关键词匹配排序"""
        scores = []
        
        for i, doc in enumerate(documents):
            score = self.calculate_keyword_score(query, doc)
            scores.append((doc, score, i))
        
        # 排序
        scores.sort(key=lambda x: x[1], reverse=True)
        
        return [
            {
                'document': doc,
                'keyword_score': score,
                'original_index': idx,
                'rank': i + 1
            }
            for i, (doc, score, idx) in enumerate(scores[:top_k])
        ]

class ChineseEnsembleRanker:
    """中文文档集成排序器"""
    
    def __init__(self):
        self.rankers = {}
        self.weights = {}
        self.processor = ChineseTextProcessor()
    
    def add_ranker(self, name, ranker, weight=1.0):
        """添加排序器"""
        self.rankers[name] = ranker
        self.weights[name] = weight
        print(f"添加排序器: {name}, 权重: {weight}")
    
    def normalize_scores(self, scores):
        """归一化分数"""
        if not scores or all(s == 0 for s in scores):
            return scores
        
        min_score = min(scores)
        max_score = max(scores)
        
        if max_score == min_score:
            return [1.0] * len(scores)
        
        return [(s - min_score) / (max_score - min_score) for s in scores]
    
    def rank_documents(self, query, documents, top_k=10, verbose=True):
        """集成排序"""
        if verbose:
            print(f"\n{'='*50}")
            print(f"查询: {query}")
            print(f"文档数量: {len(documents)}")
            print(f"{'='*50}")
        
        all_rankings = {}
        
        # 获取每个排序器的结果
        for name, ranker in self.rankers.items():
            if verbose:
                print(f"\n运行排序器: {name}")
            
            try:
                rankings = ranker.rank_documents(query, documents, top_k=len(documents))
                all_rankings[name] = rankings
                
                if verbose:
                    print(f"{name} 排序完成，Top 3 结果:")
                    for i, result in enumerate(rankings[:3]):
                        score_key = [k for k in result.keys() if 'score' in k][0]
                        print(f"  {i+1}. 分数: {result[score_key]:.4f}")
                        print(f"     文档: {result['document'][:100]}...")
                
            except Exception as e:
                print(f"排序器 {name} 运行失败: {e}")
                continue
        
        if not all_rankings:
            print("所有排序器都失败了！")
            return []
        
        # 计算加权平均分数
        doc_scores = {}
        
        for i, doc in enumerate(documents):
            doc_scores[i] = {'document': doc, 'scores': {}, 'final_score': 0}
            
            total_weight = 0
            weighted_score = 0
            
            for name, rankings in all_rankings.items():
                weight = self.weights[name]
                
                # 找到该文档在当前排序中的分数
                doc_score = 0
                for rank_info in rankings:
                    if rank_info['document'] == doc:
                        # 获取分数字段
                        score_keys = [k for k in rank_info.keys() if 'score' in k]
                        if score_keys:
                            doc_score = rank_info[score_keys[0]]
                        break
                
                doc_scores[i]['scores'][name] = doc_score
                weighted_score += weight * doc_score
                total_weight += weight
            
            if total_weight > 0:
                doc_scores[i]['final_score'] = weighted_score / total_weight
        
        # 排序并返回结果
        sorted_docs = sorted(doc_scores.items(), key=lambda x: x[1]['final_score'], reverse=True)
        
        results = []
        for i, (doc_idx, info) in enumerate(sorted_docs[:top_k]):
            result = {
                'document': info['document'],
                'final_score': info['final_score'],
                'rank': i + 1,
                'original_index': doc_idx,
                'individual_scores': info['scores']
            }
            results.append(result)
        
        return results

def analyze_query_and_documents():
    """分析查询和文档的特征"""
    processor = ChineseTextProcessor()
    
    print("查询分析:")
    print(f"查询: {SAMPLE_QUERY}")
    query_keywords = processor.extract_keywords(SAMPLE_QUERY)
    print(f"关键词: {query_keywords}")
    
    print(f"\n文档分析:")
    for i, doc in enumerate(SAMPLE_DOCUMENTS):
        print(f"\n文档 {i+1}: {doc[:50]}...")
        doc_keywords = processor.extract_keywords(doc, top_k=5)
        print(f"关键词: {list(doc_keywords.keys())}")

def run_individual_rankers():
    """运行各个排序器的示例"""
    print("\n" + "="*60)
    print("运行各个排序器")
    print("="*60)
    
    # 1. BM25排序
    print("\n1. BM25排序结果:")
    bm25_ranker = SimpleBM25Ranker()
    bm25_results = bm25_ranker.rank_documents(SAMPLE_QUERY, SAMPLE_DOCUMENTS, top_k=5)
    
    for result in bm25_results:
        print(f"排名 {result['rank']}: BM25分数 {result['bm25_score']:.4f}")
        print(f"文档: {result['document'][:100]}...\n")
    
    # 2. 关键词匹配排序
    print("\n2. 关键词匹配排序结果:")
    keyword_ranker = ChineseKeywordRanker()
    keyword_results = keyword_ranker.rank_documents(SAMPLE_QUERY, SAMPLE_DOCUMENTS, top_k=5)
    
    for result in keyword_results:
        print(f"排名 {result['rank']}: 关键词分数 {result['keyword_score']:.4f}")
        print(f"文档: {result['document'][:100]}...\n")
    
    # 3. 语义相似度排序
    print("\n3. 语义相似度排序结果:")
    try:
        semantic_ranker = ChineseSentenceTransformerRanker()
        semantic_results = semantic_ranker.rank_documents(SAMPLE_QUERY, SAMPLE_DOCUMENTS, top_k=5)
        
        for result in semantic_results:
            print(f"排名 {result['rank']}: 语义分数 {result['semantic_score']:.4f}")
            print(f"文档: {result['document'][:100]}...\n")
    except Exception as e:
        print(f"语义排序失败: {e}")

def run_ensemble_ranking():
    """运行集成排序示例"""
    print("\n" + "="*60)
    print("集成排序示例")
    print("="*60)
    
    # 创建集成排序器
    ensemble = ChineseEnsembleRanker()
    
    # 添加各种排序器
    ensemble.add_ranker('bm25', SimpleBM25Ranker(), weight=0.3)
    ensemble.add_ranker('keyword', ChineseKeywordRanker(), weight=0.3)
    
    try:
        ensemble.add_ranker('semantic', ChineseSentenceTransformerRanker(), weight=0.4)
    except Exception as e:
        print(f"语义排序器添加失败，跳过: {e}")
        # 重新调整权重
        ensemble.weights['bm25'] = 0.5
        ensemble.weights['keyword'] = 0.5
    
    # 运行集成排序
    results = ensemble.rank_documents(SAMPLE_QUERY, SAMPLE_DOCUMENTS, top_k=5, verbose=True)
    
    print(f"\n{'='*50}")
    print("最终集成排序结果:")
    print("="*50)
    
    for result in results:
        print(f"\n排名 {result['rank']}: 综合分数 {result['final_score']:.4f}")
        print(f"各排序器分数: {result['individual_scores']}")
        print(f"文档: {result['document'][:150]}...")

def compare_ranking_methods():
    """比较不同排序方法的结果"""
    print("\n" + "="*60)
    print("排序方法对比分析")
    print("="*60)
    
    # 运行所有排序器
    rankers = {
        'BM25': SimpleBM25Ranker(),
        '关键词匹配': ChineseKeywordRanker(),
    }
    
    try:
        rankers['语义相似度'] = ChineseSentenceTransformerRanker()
    except:
        print("语义相似度排序器不可用")
    
    all_results = {}
    
    for name, ranker in rankers.items():
        print(f"\n运行 {name} 排序器...")
        results = ranker.rank_documents(SAMPLE_QUERY, SAMPLE_DOCUMENTS, top_k=8)
        all_results[name] = results
    
    # 创建对比表格
    comparison_data = []
    
    for i in range(len(SAMPLE_DOCUMENTS)):
        row = {'文档ID': i+1, '文档摘要': SAMPLE_DOCUMENTS[i][:50] + '...'}
        
        for method_name, results in all_results.items():
            rank = None
            score = 0
            
            for result in results:
                if result['original_index'] == i:
                    rank = result['rank']
                    score_key = [k for k in result.keys() if 'score' in k][0]
                    score = result[score_key]
                    break
            
            row[f'{method_name}_排名'] = rank if rank else '-'
            row[f'{method_name}_分数'] = f"{score:.3f}" if score else '0.000'
        
        comparison_data.append(row)
    
    # 打印对比结果
    df = pd.DataFrame(comparison_data)
    print("\n排序方法对比表:")
    print(df.to_string(index=False))
    
    # 分析相关文档
    print(f"\n基于查询 '{SAMPLE_QUERY}' 的相关性分析:")
    relevant_docs = [0, 2, 4, 6]  # 手工标注的相关文档
    print(f"预期相关文档ID: {[x+1 for x in relevant_docs]}")
    
    for method_name, results in all_results.items():
        top3_indices = [r['original_index'] for r in results[:3]]
        relevant_in_top3 = len(set(top3_indices).intersection(set(relevant_docs)))
        print(f"{method_name}: Top3中包含 {relevant_in_top3}/3 个相关文档")

def interactive_ranking_demo():
    """交互式排序演示"""
    print("\n" + "="*60)
    print("交互式排序演示")
    print("="*60)
    
    # 准备排序器
    ensemble = ChineseEnsembleRanker()
    ensemble.add_ranker('bm25', SimpleBM25Ranker(), weight=0.4)
    ensemble.add_ranker('keyword', ChineseKeywordRanker(), weight=0.6)
    
    while True:
        print(f"\n当前有 {len(SAMPLE_DOCUMENTS)} 个文档可供检索")
        user_query = input("\n请输入您的查询（输入 'quit' 退出）: ").strip()
        
        if user_query.lower() == 'quit':
            break
        
        if not user_query:
            print("查询不能为空，请重新输入")
            continue
        
        print(f"\n正在为查询 '{user_query}' 排序文档...")
        
        results = ensemble.rank_documents(user_query, SAMPLE_DOCUMENTS, top_k=3, verbose=False)
        
        print(f"\nTop 3 相关文档:")
        for result in results:
            print(f"\n排名 {result['rank']}: 综合分数 {result['final_score']:.4f}")
            print(f"文档: {result['document']}")
            print("-" * 80)

def main():
    """主函数：完整的使用流程演示"""
    print("RAG文档排序系统 - 中文示例")
    print("="*60)
    
    # 1. 数据分析
    analyze_query_and_documents()
    
    # 2. 运行各个排序器
    run_individual_rankers()
    
    # 3. 集成排序
    run_ensemble_ranking()
    
    # 4. 方法对比
    compare_ranking_methods()
    
    # 5. 交互式演示
    print(f"\n是否启动交互式演示？(y/n): ", end="")
    if input().lower() == 'y':
        interactive_ranking_demo()
    
    print("\n演示完成！")

if __name__ == "__main__":
    # 安装必要的包
    print("请确保已安装以下包:")
    print("pip install sentence-transformers jieba scikit-learn pandas torch")
    print("="*60)
    
    main()

功能演示

数据分析 - 分析查询和文档的关键词特征
单独排序器测试 - 展示每个排序器的结果
集成排序 - 多方法融合的最终结果
方法对比 - 生成对比表格分析各方法效果
交互式演示 - 支持自定义查询测试

预期结果

对于查询"人工智能在医疗领域的应用前景如何？"，相关文档应该包括：

文档1：AI在医疗诊断中的作用
文档3：医疗AI革命性改变
文档5：智慧医疗系统
文档7：临床决策支持系统

使用建议

首次运行：会自动下载中文语义模型（约200MB）
模型选择：可根据需要更换其他中文预训练模型
权重调整：可根据实际效果调整各排序器权重
扩展性：可轻松添加新的排序算法

男士护肤品哪个牌子好？十大男士护肤品排行榜高省APP珊珊
很多男生意识到护肤的必要性，开始着手护肤，但不知道该选哪个男士护肤品品牌使用好。目前市面上很多男士护肤品品牌，可谓琳琅满目，让人眼花缭乱。男士挑选护肤品时，根据自己皮肤需求去正规渠道挑选合适的知名护肤品比较放心靠谱。高省APP，是2021年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入
《玉骨遥》：大司命为什么不杀朱颜？原因没那么简单 windy天意晚晴
《玉骨遥》里，朱颜就是时影的命劫之人。重明与时影早就知道，他们一直瞒着大司命，如今大司命也知道了真相。可是大司命却没有杀朱颜，而是给朱颜下了诛心咒，还说时影的命劫已经破了，真的如此吗？1、计划总是赶不上变化的大司命从目前剧情来说，大司命还不如时影，他信心十足的事情总会有纰漏。他不让时影见命劫之女，结果时影还是遇上了。他想让时影走火入魔，一心复仇，结果时影在朱颜的劝说下放下了仇恨。大司命让时影开山收
day15｜前端框架学习和算法 universe_01 前端算法笔记
T22括号生成先把所有情况都画出来，然后（在满足什么情况下）把不符合条件的删除。T78子集要画树状图，把思路清晰。可以用暴力法、回溯法和DFS做这个题DFS深度搜索：每个边都走完，再回溯应用：二叉树搜索，图搜索回溯算法=DFS+剪枝T200岛屿数量（非常经典BFS宽度把树状转化成队列形式，lambda匿名函数“一次性的小函数，没有名字”setup语法糖：让代码更简洁好写的语法ref创建：基本类型的
C++ 计数排序、归并排序、快速排序每天搬一点点砖 c++数据结构算法
计数排序：是一种基于哈希的排序算法。他的基本思想是通过统计每个元素的出现次数，然后根据统计结果将元素依次放入排序后的序列中。这种排序算法适用于范围较小的情况，例如整数范围在0到k之间计数排序步骤：1初始化一个长度为最大元素值加1的计数数组，所有元素初始化为02遍历原始数组，将每个元素值作为索引，在计数数组中对应位置加13将数组清空4遍历计数器数组，按照数组中的元素个数放回到元数组中计数排序的优点和
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
JVM 内存模型深度解析：原子性、可见性与有序性的实现练习时长两年半的程序员小胡 JVM 深度剖析：从面试考点到生产实践 jvm java 内存模型
在了解了JVM的基础架构和类加载机制后，我们需要进一步探索Java程序在多线程环境下的内存交互规则。JVM内存模型（JavaMemoryModel，JMM）定义了线程和主内存之间的抽象关系，它通过规范共享变量的访问方式，解决了多线程并发时的数据一致性问题。本文将从内存模型的核心目标出发，详解原子性、可见性、有序性的实现机制，以及volatile、synchronized等关键字在其中的作用。一、J
Flowable 实战落地核心：选型决策与坑点破解练习时长两年半的程序员小胡 Flowable 流程引擎实战指南低代码 BPMN 流程引擎 flowable 后端 java
在企业级流程引擎的落地过程中，选型的准确性和坑点的预见性直接决定项目成败。本文聚焦Flowable实战中最关键的“选型决策”与“常见坑点”，结合真实项目经验，提供可落地的解决方案。一、流程引擎选型：从业务本质出发1.1选型的三大核心维度企业在选择流程引擎时，需避免陷入“技术崇拜”，应回归业务本质。评估Flowable是否适用，可从三个维度判断：业务复杂度若流程涉及动态审批链（如按金额自动升级审批）
SpringMVC的执行流程
1、什么是MVCMVC是一种设计模式。MVC的原理图如下所示M-Model模型（完成业务逻辑：有javaBean构成，service+dao+entity）V-View视图（做界面的展示jsp，html……）C-Controller控制器（接收请求—>调用模型—>根据结果派发页面2、SpringMVC是什么SpringMVC是一个MVC的开源框架，SpringMVC=Struts2+Spring，
力扣面试题07 - 旋转矩阵茶猫_ leetcode 矩阵算法 c语言
题目：给你一幅由N×N矩阵表示的图像，其中每个像素的大小为4字节。请你设计一种算法，将图像旋转90度。不占用额外内存空间能否做到？示例1:给定matrix=[[1,2,3],[4,5,6],[7,8,9]],原地旋转输入矩阵，使其变为:[[7,4,1],[8,5,2],[9,6,3]]示例2:给定matrix=[[5,1,9,11],[2,4,8,10],[13,3,6,7],[15,14,12,
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
模拟退火(SA)：如何“故意走错路”，才能找到最优解？小瑞瑞acd 小瑞瑞学数模模拟退火算法 python 启发式算法算法
模拟退火(SA)：如何“故意走错路”，才能找到最优解？图示模拟退火算法如何通过接受较差解（橙色虚线标注）从局部最优（绿色点）逃逸，最终找到全局最优解（紫色点），展示其跳出局部极小值的能力。大家好，我是小瑞瑞！欢迎回到我的专栏！想象一下，你站在一座连绵不绝的山脉中，目标是找到海拔最低的那个山谷。你手上只有一个高度计，视野被浓雾笼罩，只能看清脚下的一小片区域。如果你是一个“贪心”的登山者，你的策略会非
今晚吃太饱了爱伤心的蚂蚁
今晚吃太饱了，两碗干饭，两碗肉汤，一碗牛奶银耳汤，感觉肚子都顶出来了，圆滚滚的！明早要早起，出发去小蚂蚁家！看着剩下的肉汤，倒掉多可惜，干掉了！看着小蚂蚁熬的银耳汤，倒掉多可惜，于是热了一下，顺便热袋牛奶倒进去，大娃喝点，小蚂蚁喝点，还剩下一大碗，继续干掉！吃的太饱，人也懒洋洋的，躺床上不想动，感受的肚子撑撑的感觉，好久没吃这么饱了！这一晚灌的都是汤汤水水的，天冷的晚上，半夜要睡不安稳咯！哈哈！小
你对待万事万物的态度行靜
昨晚爸爸把洒水壶灌满水，对我说：你也该去浇浇你阳台上的花咯。这么大的天气，几天没浇水都快死了。我才意识到自己容易突然间忽视一些事情。尤其是身旁的一些事，可能它们呆久了，反而习以为常。想想每天的生活状态就是在不断的重复着一些事，有点固定模式。没有什么特别发生。记录我的一天：上班，挤公交，用手机或电脑，吃饭，上课。没有
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
图论算法经典题目解析：DFS、BFS与拓扑排序实战周童學数据结构与算法深度优先算法图论
图论算法经典题目解析：DFS、BFS与拓扑排序实战图论问题是算法面试中的高频考点，本博客将通过四道LeetCode经典题目（均来自"Top100Liked"题库），深入讲解图论的核心算法思想和实现技巧。涵盖DFS、BFS、拓扑排序和前缀树等知识点，每道题配有Java实现和易错点分析。1.岛屿数量(DFS遍历)问题描述给定一个由'1'(陆地)和'0'(水)组成的二维网格，计算岛屿的数量。岛屿由水平或
承德十大亲子鉴定医院名单(附2024年10所正规医院) 国医基因陈主任
承德哪家医院可以做亲子鉴定？承德市中心医院、中国人民解放军第二六六医院、承德医学院附属医院等都可以做常规亲子鉴定采样采集，一般的医院并不可以为你提供常规亲子鉴定检测的服务。承德亲子鉴定中心地址：承德市西大街路北11号（承德国医基因）。一般只有少数三甲医院可以做亲子鉴定采样，或者当地亲子鉴定中心可以做亲子鉴定。如果想做亲子鉴定，最好直接到亲子鉴定中心内或亲子鉴定医院采样点内进行双方抽血鉴定，这样会更
践行8.0~第六周11.25-12.02 初队长
突破后的喜悦最可怕的不是自己不清楚，而是自己清楚了，却依然不心动，我想这就是我们每个人的惰性存在，在这一周的践行，我发现自己依然是停留在自己的模式当中，不断的恶性的轮回，虽然的话，那再晨间日记方面是纸质的填写，但是对一天的工作没有起到应有的计划和推动的作用而我自己呢，也有些时候的话会处于一个相对来讲放松的一个状态，时间的把控的话也有一些点的消极，所以在这周的间隙，重点是关注自己的三大目标为目标来进
5G基站信号加速器！AD8021ARZ-REEL7亚德诺超低噪声高速电压放大器专利失真消除技术! 深圳市尚想信息技术有限公司 5G通信高速运放 ADI黑科技 8K视频医疗超声
AD8021ARZ-REEL7ADI：重新定义高速放大器的性能极限！一、产品简介AD8021ARZ-REEL7是ADI（亚德诺半导体）推出的超低噪声高速电压反馈放大器，采用XFCB工艺和专利失真消除技术，专为4K/8K视频处理、医疗成像、5G通信等超高频应用设计。以1.8GHz带宽和0.1nV/√Hz超低噪声，成为高速信号调理的终极解决方案！二、五大颠覆性优势军工级信号保真度1.8GHz-3dB带
打造自己的梦想生态系统轻风style
今天听了第5周5.1的梦想系统和随堂练习：梦想仓库与八大关注表。参照老师给出的例子，列出了八大关注对应的自己的梦想。有些写的时候内心都在怀疑，但因为老师有说到，要没有分别心的去列出，不管是近的，远的，小的，大的，自己觉得可以实现的，或者觉得根本不可能实现的，都统统的列出来。就像音频中提到的，林语堂说过的话，梦想无论怎样模糊，总潜伏在我们心底，使我们的心境永远得不到宁静，直到这些梦想成为事实才止；像
我是孩子妈妈，我会让孩子饿着吗？松玲子
回老家过年，就是一场在关于喂养孩子问题上与老人的巅峰对决。前天我们回老家了，他爷爷奶奶就说孩子瘦了，就说我喂的不好，不按时喂，第一天夜里孩子总是睡一会就哭，睡一会就哭，夜里不知醒了多少次，弄得我真是几乎彻夜未眠。一大早，我还没起，我就听见他爷爷奶奶在外边说，今黑夜阳阳怎么老哭，是不是饿的，然后又延伸到我喂养的问题上，说不吃盐不行，不吃盐孩子没劲，吃蛋光吃个蛋黄，吃不饱，给他吃全蛋就行，哎呀我去，我
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
心力践行营十二期一阶学习打卡 LX_王彤彤
姓名：王彤彤时间：2021年4月24日一：朗读师父的十大人生哲学二：师父的早安分享感悟很喜欢这句话：所有的行动都是基于目标的尝试，没有所谓的失败，只是不同尝试后得到的不同结果，让我们更好地调整下一次的行动。三：感恩日记1.我太幸福了，我很感恩姑姑，因为姑姑放假又投喂了我，还给我带了饺子回家，这让我感觉很幸福。谢谢，谢谢，谢谢。2.我太幸福了，我很感恩师父晚上的直播，因为听他的分享我知道怎么更好的去
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
京东中秋节会打折吗？京东中秋节活动力度大吗？高省APP珊珊
京东中秋节会打折，并且活动力度通常是比较大的。以下是具体分析：京东中秋节打折情况降价促销：京东在中秋节期间会推出大规模的降价促销活动，涵盖食品、家居、家电等多个品类，以及众多热门品牌。消费者可以在此期间享受到实实在在的降价优惠。多种优惠形式：除了直接的降价促销，京东还会通过满减优惠、折扣促销、限时秒杀等多种形式的优惠活动来吸引消费者。这些优惠活动通常具有较高的吸引力，能够激发消费者的购买欲望。目前
Android 应用权限管理详解
文章目录1.权限类型2.权限请求机制3.权限组和分级4.权限管理的演进5.权限监控和SELinux强制访问控制6.应用权限审核和GooglePlayProtect7.开发者最佳实践8.用户权限管理9.Android应用沙箱模型10.ScopedStorage（分区存储）11.背景位置权限（BackgroundLocationAccess）12.权限回收和自动清理13.权限请求的用户体验设计14.G
AI模型训练中过拟合和欠拟合的区别是什么？ workflower 人工智能算法人工智能数据分析
在AI模型训练中，过拟合和欠拟合是两种常见的模型性能问题，核心区别在于模型对数据的学习程度和泛化能力：欠拟合（Underfitting）-定义：模型未能充分学习到数据中的规律，对训练数据的拟合程度较差，在训练集和测试集上的表现都不好（如准确率低、损失值高）。-原因：-模型结构过于简单（如用线性模型解决非线性问题）；-训练数据量不足或特征信息不充分；-训练时间太短，模型尚未学到有效模式。-表现：训练
农场种蔬菜赚钱小游戏有哪些五大可以赚钱的小游戏APP 氧惠帮朋友一起省
喜欢种菜吗？我特意带来农场种蔬菜赚钱小游戏排行榜2022，线上汇集了超多模拟种菜玩法，玩家可以免费种植赚钱哦！每天都有大量的种植任务，线上完成就能赚钱哦！快来下载吧！1.氧惠APP购物、看电影、点外卖、用氧惠APP！更优惠！氧惠（全网优惠上氧惠）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面，送1:1超级补贴(邀请好友自购多少，你就推广得多少，非常厉害)，欢迎各位
严重的DDoS 攻击澳大利亚主要宽带提供商 Fancy1816575412
本周早些时候，澳大利亚最大的固定无线宽带运营商CirrusCommunications遭受了一次重大的DDoS攻击，导致其一半以上的网络瘫痪。该公司在其网站上声称：“强大的架构、数百个传输站点以及光纤和微波回程的使用使其能够以非常高的正常运行时间提供高速”。CirrusCommunications表示，它覆盖了澳大利亚十大人口中心以及几个主要的区域中心，主要为企业和政府客户提供服务。然而，据The
3次创业身价百亿，2年前却被大众判“死刑”，李想如今怎样了？职心眼儿
他，19岁放弃高考去创业；25岁，成为亿万富豪，被央视评为“80后创业”领军人物；39岁，身价再次暴涨，一夜间闯过200亿大关。他，在3个领域连续创业20年，一家公司市值700亿，一家公司市值2000亿。而他的最高学历，却只有高中。这个人，就是理想汽车的创始人——李想。纵观李想的创业史，可谓是颇为传奇：一个既没背景，又没资金高中毕业生，怎么就让3位互联网巨头（张一鸣、王兴、程维）同时为自己站台？更
戴尔笔记本win8系统改装win7系统 sophia天雪 win7 戴尔改装系统 win8
戴尔win8 系统改装win7 系统详述第一步：使用U盘制作虚拟光驱： 1）下载安装UltraISO：注册码可以在网上搜索。 2）启动UltraISO，点击“文件”—》“打开”按钮，打开已经准备好的ISO镜像文
BeanUtils.copyProperties使用笔记 bylijinnan java
BeanUtils.copyProperties VS PropertyUtils.copyProperties 两者最大的区别是： BeanUtils.copyProperties会进行类型转换，而PropertyUtils.copyProperties不会。既然进行了类型转换，那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
MyEclipse中文乱码问题 0624chenhong MyEclipse
一、设置新建常见文件的默认编码格式，也就是文件保存的格式。在不对MyEclipse进行设置的时候，默认保存文件的编码，一般跟简体中文操作系统（如windows2000，windowsXP）的编码一致，即GBK。在简体中文系统下，ANSI 编码代表 GBK编码;在日文操作系统下，ANSI 编码代表 JIS 编码。 Window-->Preferences-->General -
发送邮件不懂事的小屁孩 send email
import org.apache.commons.mail.EmailAttachment; import org.apache.commons.mail.EmailException; import org.apache.commons.mail.HtmlEmail; import org.apache.commons.mail.MultiPartEmail;
动画合集换个号韩国红果果 html css
动画指一种样式变为另一种样式 keyframes应当始终定义0 100 过程 1 transition 制作鼠标滑过图片时的放大效果 css .wrap{ width: 340px;height: 340px; position: absolute; top: 30%; left: 20%; overflow: hidden; bor
网络最常见的攻击方式竟然是SQL注入蓝儿唯美 sql注入
NTT研究表明，尽管SQL注入（SQLi）型攻击记录详尽且为人熟知，但目前网络应用程序仍然是SQLi攻击的重灾区。信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明，目前黑客攻击网络应用程序方式中最流行的，要数SQLi攻击。报告对去年发生的60亿攻击行为进行分析，指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中，SQLi攻击占
java笔记2 a-john java
类的封装： 1，java中，对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节（尤其是私有数据） 2，目的：使对象以外的部分不能随意存取对象的内部数据（如属性），从而使软件错误能够局部化，减少差错和排错的难度。 3，简单来说，“隐藏属性、方法或实现细节的过程”称为——封装。 4，封装的特性： 4.1设置
[Andengine]Error：can't creat bitmap form path “gfx/xxx.xxx” aijuans 学习Android遇到的错误
最开始遇到这个错误是很早以前了，以前也没注意，只当是一个不理解的bug，因为所有的texture，textureregion都没有问题，但是就是提示错误。昨天和美工要图片，本来是要背景透明的png格式，可是她却给了我一个jpg的。说明了之后她说没法改，因为没有png这个保存选项。我就看了一下，和她要了psd的文件，还好我有一点
自己写的一个繁体到简体的转换程序 asialee java 转换繁体 filter 简体
今天调研一个任务，基于java的filter实现繁体到简体的转换，于是写了一个demo，给各位博友奉上，欢迎批评指正。实现的思路是重载request的调取参数的几个方法，然后做下转换。
android意图和意图监听器技术百合不是茶 android 显示意图隐式意图意图监听器
Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递显式意图：调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图，显式意图明确指定了Intent应该传递给哪个组件。隐式意图;不指明调用的名称,根据设
spring3中新增的@value注解 bijian1013 java spring @Value
在spring 3.0中，可以通过使用@value，对一些如xxx.properties文件中的文件，进行键值对的注入，例子如下： 1.首先在applicationContext.xml中加入： <beans xmlns="http://www.springframework.
Jboss启用CXF日志 sunjing log jboss CXF
1. 在standalone.xml配置文件中添加system-properties： <system-properties> <property name="org.apache.cxf.logging.enabled" value=&
【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码 bit1129 centos
编译必需的软件 Firebugs3.0.0 Maven3.2.3 Ant JDK1.7.0_67 protobuf-2.5.0 Hadoop 2.5.2源码包 Firebugs3.0.0 http://sourceforge.jp/projects/sfnet_findbug
struts2验证框架的使用和扩展白糖_ 框架 xml bean struts 正则表达式
struts2能够对前台提交的表单数据进行输入有效性校验，通常有两种方式： 1、在Action类中通过validatexx方法验证，这种方式很简单，在此不再赘述； 2、通过编写xx-validation.xml文件执行表单验证，当用户提交表单请求后，struts会优先执行xml文件，如果校验不通过是不会让请求访问指定action的。本文介绍一下struts2通过xml文件进行校验的方法并说
记录-感悟 braveCS 感悟
再翻翻以前写的感悟，有时会发现自己很幼稚，也会让自己找回初心。 2015-1-11 1. 能在工作之余学习感兴趣的东西已经很幸福了； 2. 要改变自己，不能这样一直在原来区域，要突破安全区舒适区，才能提高自己，往好的方面发展； 3. 多反省多思考；要会用工具，而不是变成工具的奴隶； 4. 一天内集中一个定长时间段看最新资讯和偏流式博
编程之美-数组中最长递增子序列 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class LongestAccendingSubSequence { /** * 编程之美数组中最长递增子序列 * 书上的解法容易理解 * 另一方法书上没有提到的是，可以将数组排序（由小到大）得到新的数组， * 然后求排序后的数组与原数
读书笔记5 chengxuyuancsdn 重复提交 struts2的token验证
1、重复提交 2、struts2的token验证 3、用response返回xml时的注意 1、重复提交 (1)应用场景 (1-1)点击提交按钮两次。 (1-2)使用浏览器后退按钮重复之前的操作，导致重复提交表单。 (1-3)刷新页面 (1-4)使用浏览器历史记录重复提交表单。 (1-5)浏览器重复的 HTTP 请求。 (2)解决方法 (2-1)禁掉提交按钮 (2-2)
[时空与探索]全球联合进行第二次费城实验的可能性 comsci
二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验至今给我们大家留下很多迷团..... 关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了在这里,我的意思是,现在
easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符 daizj oracle ORA-12154
用easy connect连接出现“tns无法解析指定的连接标示符”的错误，如下： C:\Users\Administrator>sqlplus username/[email protected]:1521/orcl SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012 Copyright (c) 198
简单排序:归并排序 dieslrae 归并排序
public void mergeSort(int[] array){ int temp = array.length/2; if(temp == 0){ return; } int[] a = new int[temp]; int
C语言中字符串的\0和空格 dcj3sjt126com c
\0 为字符串结束符，比如说： abcd (空格)cdefg；存入数组时，空格作为一个字符占有一个字节的空间，我们
解决Composer国内速度慢的办法 dcj3sjt126com Composer
用法：有两种方式启用本镜像服务： 1 将以下配置信息添加到 Composer 的配置文件 config.json 中（系统全局配置）。见“例1” 2 将以下配置信息添加到你的项目的 composer.json 文件中（针对单个项目配置）。见“例2” 为了避免安装包的时候都要执行两次查询，切记要添加禁用 packagist 的设置，如下 1 2 3 4 5
高效可伸缩的结果缓存 shuizhaosi888 高效可伸缩的结果缓存
/** * 要执行的算法，返回结果v */ public interface Computable<A, V> { public V comput(final A arg); } /** * 用于缓存数据 */ public class Memoizer<A, V> implements Computable<A,
三点定位的算法 haoningabc c 算法
三点定位，已知a,b,c三个顶点的x,y坐标和三个点都z坐标的距离，la，lb,lc 求z点的坐标原理就是围绕a,b,c 三个点画圆，三个圆焦点的部分就是所求但是，由于三个点的距离可能不准，不一定会有结果，所以是三个圆环的焦点，环的宽度开始为0，没有取到则加1 运行 gcc -lm test.c test.c代码如下 #include "stdi
epoll使用详解 jimmee c linux 服务端编程 epoll
epoll - I/O event notification facility在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，在linu
Hibernate对Enum的映射的基本使用方法 linzx0212 enum Hibernate
枚举 /** * 性别枚举 */ public enum Gender { MALE(0), FEMALE(1), OTHER(2); private Gender(int i) { this.i = i; } private int i; public int getI
第10章高级事件（下） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
孙子兵法 roadrunners 孙子兵法
始计第一孙子曰：兵者，国之大事，死生之地，存亡之道，不可不察也。故经之以五事，校之以计，而索其情：一曰道，二曰天，三曰地，四曰将，五曰法。道者，令民于上同意，可与之死，可与之生，而不危也；天者，阴阳、寒暑、时制也；地者，远近、险易、广狭、死生也；将者，智、信、仁、勇、严也；法者，曲制、官道、主用也。凡此五者，将莫不闻，知之者胜，不知之者不胜。故校之以计，而索其情，曰
MySQL双向复制 tomcat_oracle mysql
本文包括: 主机配置从机配置建立主-从复制建立双向复制背景按照以下简单的步骤: 参考一下：在机器A配置主机(192.168.1.30) 在机器B配置从机(192.168.1.29) 我们可以使用下面的步骤来实现这一点步骤1：机器A设置主机在主机中打开配置文件 ,
zoj 3822 Domination(dp) 阿尔萨斯 Mina
题目链接：zoj 3822 Domination 题目大意：给定一个N∗M的棋盘，每次任选一个位置放置一枚棋子，直到每行每列上都至少有一枚棋子，问放置棋子个数的期望。解题思路：大白书上概率那一张有一道类似的题目，但是因为时间比较久了，还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子，并且消耗k步的概率（k≤i∗j）,因为放置在i+1~n上等价与放在i+1行上，同理