weixin_37763484

【RAG排序】rag排序代码示例-高级版

以下是利用claude生成的排序示例，相对来说高级一些，例如使用了图排序、混合排序、mmr等技术。

代码是示例代码，受输出长度限制，无法给出完整例子，在最后对输入的query、document_embedding等进行了实例展示。可以参考“使用案例解释”尝试进行修改和运行。

RAG系统排序阶段的多种方法与实现

1. 基础排序方法

1.1 余弦相似度排序

最基本的相似度计算方法，适用于向量检索后的重排序。

import numpy as np
from sklearn.metrics.pairwise import cosine_similarity
import torch
import torch.nn.functional as F

def cosine_similarity_ranking(query_embedding, doc_embeddings, documents, top_k=10):
    """
    基于余弦相似度的文档排序
    """
    similarities = cosine_similarity(
        query_embedding.reshape(1, -1), 
        doc_embeddings
    )[0]
    
    # 获取排序索引
    sorted_indices = np.argsort(similarities)[::-1][:top_k]
    
    ranked_docs = []
    for idx in sorted_indices:
        ranked_docs.append({
            'document': documents[idx],
            'score': similarities[idx],
            'rank': len(ranked_docs) + 1
        })
    
    return ranked_docs

# PyTorch版本
def cosine_similarity_torch(query_emb, doc_embs):
    """使用PyTorch计算余弦相似度"""
    query_emb = F.normalize(query_emb, p=2, dim=-1)
    doc_embs = F.normalize(doc_embs, p=2, dim=-1)
    similarities = torch.mm(query_emb.unsqueeze(0), doc_embs.T)
    return similarities.squeeze()

1.2 欧几里得距离排序

def euclidean_distance_ranking(query_embedding, doc_embeddings, documents, top_k=10):
    """
    基于欧几里得距离的文档排序（距离越小，相关性越高）
    """
    distances = np.linalg.norm(doc_embeddings - query_embedding, axis=1)
    
    # 距离越小越相关，所以升序排列
    sorted_indices = np.argsort(distances)[:top_k]
    
    ranked_docs = []
    for idx in sorted_indices:
        ranked_docs.append({
            'document': documents[idx],
            'distance': distances[idx],
            'score': 1 / (1 + distances[idx]),  # 转换为相似度分数
            'rank': len(ranked_docs) + 1
        })
    
    return ranked_docs

2. 基于深度学习的重排序模型

2.1 Cross-Encoder重排序

from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch

class CrossEncoderRanker:
    def __init__(self, model_name="cross-encoder/ms-marco-MiniLM-L-6-v2"):
        self.tokenizer = AutoTokenizer.from_pretrained(model_name)
        self.model = AutoModelForSequenceClassification.from_pretrained(model_name)
        self.device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
        self.model.to(self.device)
        self.model.eval()
    
    def rank_documents(self, query, documents, top_k=10):
        """
        使用Cross-Encoder对文档进行重排序
        """
        query_doc_pairs = [(query, doc) for doc in documents]
        
        # 分批处理以避免内存问题
        batch_size = 32
        scores = []
        
        for i in range(0, len(query_doc_pairs), batch_size):
            batch_pairs = query_doc_pairs[i:i+batch_size]
            
            # 编码输入
            inputs = self.tokenizer(
                batch_pairs,
                padding=True,
                truncation=True,
                max_length=512,
                return_tensors="pt"
            ).to(self.device)
            
            with torch.no_grad():
                outputs = self.model(**inputs)
                batch_scores = torch.softmax(outputs.logits, dim=-1)[:, 1].cpu().numpy()
                scores.extend(batch_scores)
        
        # 排序并返回top_k
        scored_docs = list(zip(documents, scores))
        scored_docs.sort(key=lambda x: x[1], reverse=True)
        
        return [
            {
                'document': doc,
                'score': score,
                'rank': i + 1
            }
            for i, (doc, score) in enumerate(scored_docs[:top_k])
        ]

2.2 Bi-Encoder重排序

from sentence_transformers import SentenceTransformer
import numpy as np

class BiEncoderRanker:
    def __init__(self, model_name="sentence-transformers/all-MiniLM-L6-v2"):
        self.model = SentenceTransformer(model_name)
    
    def rank_documents(self, query, documents, top_k=10):
        """
        使用Bi-Encoder对文档进行重排序
        """
        # 编码查询和文档
        query_embedding = self.model.encode([query], convert_to_tensor=True)
        doc_embeddings = self.model.encode(documents, convert_to_tensor=True)
        
        # 计算相似度
        similarities = torch.cosine_similarity(
            query_embedding.unsqueeze(1), 
            doc_embeddings.unsqueeze(0), 
            dim=2
        ).squeeze().cpu().numpy()
        
        # 排序
        sorted_indices = np.argsort(similarities)[::-1][:top_k]
        
        return [
            {
                'document': documents[idx],
                'score': similarities[idx],
                'rank': i + 1
            }
            for i, idx in enumerate(sorted_indices)
        ]

3. 混合排序方法

3.1 多因子加权排序

class MultiFactorRanker:
    def __init__(self, weights=None):
        self.weights = weights or {
            'semantic_similarity': 0.4,
            'keyword_match': 0.3,
            'document_length': 0.1,
            'freshness': 0.1,
            'authority': 0.1
        }
    
    def calculate_keyword_score(self, query, document):
        """计算关键词匹配分数"""
        query_words = set(query.lower().split())
        doc_words = set(document.lower().split())
        
        intersection = query_words.intersection(doc_words)
        union = query_words.union(doc_words)
        
        return len(intersection) / len(union) if union else 0
    
    def calculate_length_score(self, document, optimal_length=500):
        """计算文档长度分数"""
        length = len(document.split())
        return 1 / (1 + abs(length - optimal_length) / optimal_length)
    
    def calculate_freshness_score(self, timestamp, current_time):
        """计算时效性分数"""
        age_days = (current_time - timestamp).days
        return 1 / (1 + age_days / 30)  # 30天为半衰期
    
    def rank_documents(self, query, documents, doc_embeddings=None, 
                      query_embedding=None, metadata=None, top_k=10):
        """
        综合多个因子进行排序
        """
        scores = []
        
        for i, doc in enumerate(documents):
            doc_score = 0
            
            # 语义相似度
            if doc_embeddings is not None and query_embedding is not None:
                semantic_sim = cosine_similarity(
                    query_embedding.reshape(1, -1),
                    doc_embeddings[i].reshape(1, -1)
                )[0][0]
                doc_score += self.weights['semantic_similarity'] * semantic_sim
            
            # 关键词匹配
            keyword_score = self.calculate_keyword_score(query, doc)
            doc_score += self.weights['keyword_match'] * keyword_score
            
            # 文档长度
            length_score = self.calculate_length_score(doc)
            doc_score += self.weights['document_length'] * length_score
            
            # 时效性和权威性（如果有元数据）
            if metadata and i < len(metadata):
                if 'timestamp' in metadata[i]:
                    freshness_score = self.calculate_freshness_score(
                        metadata[i]['timestamp'], 
                        metadata[i].get('current_time', datetime.now())
                    )
                    doc_score += self.weights['freshness'] * freshness_score
                
                if 'authority_score' in metadata[i]:
                    doc_score += self.weights['authority'] * metadata[i]['authority_score']
            
            scores.append((doc, doc_score, i))
        
        # 排序并返回top_k
        scores.sort(key=lambda x: x[1], reverse=True)
        
        return [
            {
                'document': doc,
                'score': score,
                'original_index': idx,
                'rank': i + 1
            }
            for i, (doc, score, idx) in enumerate(scores[:top_k])
        ]

3.2 学习到排序(Learning to Rank)

import lightgbm as lgb
from sklearn.model_selection import train_test_split
import pandas as pd

class LearningToRankModel:
    def __init__(self):
        self.model = None
        self.feature_names = [
            'cosine_similarity',
            'keyword_match_score',
            'bm25_score',
            'document_length',
            'query_length',
            'common_words_ratio',
            'edit_distance_norm'
        ]
    
    def extract_features(self, query, document, query_emb=None, doc_emb=None):
        """提取特征"""
        features = {}
        
        # 余弦相似度
        if query_emb is not None and doc_emb is not None:
            features['cosine_similarity'] = cosine_similarity(
                query_emb.reshape(1, -1), 
                doc_emb.reshape(1, -1)
            )[0][0]
        else:
            features['cosine_similarity'] = 0
        
        # 关键词匹配分数
        query_words = set(query.lower().split())
        doc_words = set(document.lower().split())
        intersection = query_words.intersection(doc_words)
        features['keyword_match_score'] = len(intersection) / len(query_words) if query_words else 0
        
        # BM25分数（简化版）
        features['bm25_score'] = self.simple_bm25(query, document)
        
        # 文档和查询长度
        features['document_length'] = len(document.split())
        features['query_length'] = len(query.split())
        
        # 公共词比例
        features['common_words_ratio'] = len(intersection) / len(query_words.union(doc_words)) if query_words.union(doc_words) else 0
        
        # 编辑距离（归一化）
        from difflib import SequenceMatcher
        features['edit_distance_norm'] = SequenceMatcher(None, query.lower(), document.lower()[:len(query)*2]).ratio()
        
        return features
    
    def simple_bm25(self, query, document, k1=1.2, b=0.75):
        """简化的BM25计算"""
        query_terms = query.lower().split()
        doc_terms = document.lower().split()
        doc_length = len(doc_terms)
        avg_doc_length = 100  # 假设平均文档长度
        
        score = 0
        for term in query_terms:
            tf = doc_terms.count(term)
            if tf > 0:
                idf = 1  # 简化，实际应该计算逆文档频率
                score += idf * (tf * (k1 + 1)) / (tf + k1 * (1 - b + b * (doc_length / avg_doc_length)))
        
        return score
    
    def train(self, training_data):
        """
        训练排序模型
        training_data: List of (query, documents, relevance_scores)
        """
        features_list = []
        labels_list = []
        groups = []
        
        for query, documents, relevance_scores in training_data:
            group_size = len(documents)
            groups.append(group_size)
            
            for doc, relevance in zip(documents, relevance_scores):
                features = self.extract_features(query, doc)
                features_list.append(list(features.values()))
                labels_list.append(relevance)
        
        # 创建LightGBM数据集
        train_data = lgb.Dataset(
            features_list, 
            label=labels_list, 
            group=groups,
            feature_name=self.feature_names
        )
        
        # 训练模型
        params = {
            'objective': 'lambdarank',
            'metric': 'ndcg',
            'ndcg_eval_at': [1, 3, 5, 10],
            'num_leaves': 31,
            'learning_rate': 0.05,
            'feature_fraction': 0.9
        }
        
        self.model = lgb.train(
            params,
            train_data,
            num_boost_round=100,
            valid_sets=[train_data],
            callbacks=[lgb.early_stopping(10)]
        )
    
    def rank_documents(self, query, documents, top_k=10):
        """使用训练好的模型对文档排序"""
        if self.model is None:
            raise ValueError("Model not trained yet!")
        
        features_list = []
        for doc in documents:
            features = self.extract_features(query, doc)
            features_list.append(list(features.values()))
        
        scores = self.model.predict(features_list)
        
        # 排序
        scored_docs = list(zip(documents, scores))
        scored_docs.sort(key=lambda x: x[1], reverse=True)
        
        return [
            {
                'document': doc,
                'score': score,
                'rank': i + 1
            }
            for i, (doc, score) in enumerate(scored_docs[:top_k])
        ]

4. 高级排序策略

4.1 多样性排序（MMR - Maximal Marginal Relevance）

def maximal_marginal_relevance(query_embedding, doc_embeddings, documents, 
                              lambda_param=0.7, top_k=10):
    """
    最大边际相关性排序，平衡相关性和多样性
    lambda_param: 控制相关性和多样性的权重
    """
    if len(documents) == 0:
        return []
    
    # 计算与查询的相似度
    query_similarities = cosine_similarity(
        query_embedding.reshape(1, -1), 
        doc_embeddings
    )[0]
    
    selected = []
    remaining_indices = list(range(len(documents)))
    
    # 选择第一个最相关的文档
    first_idx = np.argmax(query_similarities)
    selected.append(first_idx)
    remaining_indices.remove(first_idx)
    
    # 迭代选择剩余文档
    while len(selected) < top_k and remaining_indices:
        mmr_scores = []
        
        for idx in remaining_indices:
            # 相关性分数
            relevance_score = query_similarities[idx]
            
            # 与已选择文档的最大相似度
            if selected:
                selected_embeddings = doc_embeddings[selected]
                current_embedding = doc_embeddings[idx].reshape(1, -1)
                similarities_to_selected = cosine_similarity(
                    current_embedding, 
                    selected_embeddings
                )[0]
                max_similarity = np.max(similarities_to_selected)
            else:
                max_similarity = 0
            
            # MMR分数
            mmr_score = (lambda_param * relevance_score - 
                        (1 - lambda_param) * max_similarity)
            mmr_scores.append((idx, mmr_score))
        
        # 选择MMR分数最高的文档
        best_idx, best_score = max(mmr_scores, key=lambda x: x[1])
        selected.append(best_idx)
        remaining_indices.remove(best_idx)
    
    # 构建结果
    result = []
    for i, idx in enumerate(selected):
        result.append({
            'document': documents[idx],
            'relevance_score': query_similarities[idx],
            'rank': i + 1
        })
    
    return result

4.2 基于图的排序（PageRank风格）

import networkx as nx

class GraphBasedRanker:
    def __init__(self, similarity_threshold=0.5):
        self.similarity_threshold = similarity_threshold
    
    def build_similarity_graph(self, doc_embeddings, documents):
        """构建文档相似度图"""
        G = nx.Graph()
        
        # 添加节点
        for i, doc in enumerate(documents):
            G.add_node(i, document=doc)
        
        # 添加边（基于相似度）
        n_docs = len(documents)
        similarities = cosine_similarity(doc_embeddings)
        
        for i in range(n_docs):
            for j in range(i + 1, n_docs):
                similarity = similarities[i][j]
                if similarity > self.similarity_threshold:
                    G.add_edge(i, j, weight=similarity)
        
        return G
    
    def rank_documents(self, query_embedding, doc_embeddings, documents, 
                      alpha=0.85, max_iter=100, top_k=10):
        """
        使用类似PageRank的算法对文档排序
        """
        # 构建相似度图
        G = self.build_similarity_graph(doc_embeddings, documents)
        
        # 计算与查询的相似度作为个性化向量
        query_similarities = cosine_similarity(
            query_embedding.reshape(1, -1), 
            doc_embeddings
        )[0]
        
        # 归一化个性化向量
        personalization = {}
        total_sim = np.sum(query_similarities)
        for i, sim in enumerate(query_similarities):
            personalization[i] = sim / total_sim if total_sim > 0 else 1/len(documents)
        
        # 运行个性化PageRank
        try:
            pagerank_scores = nx.pagerank(
                G, 
                alpha=alpha, 
                personalization=personalization,
                max_iter=max_iter
            )
        except:
            # 如果图不连通，回退到基础相似度排序
            pagerank_scores = {i: sim for i, sim in enumerate(query_similarities)}
        
        # 排序并返回结果
        sorted_docs = sorted(
            pagerank_scores.items(), 
            key=lambda x: x[1], 
            reverse=True
        )[:top_k]
        
        result = []
        for rank, (doc_idx, score) in enumerate(sorted_docs):
            result.append({
                'document': documents[doc_idx],
                'pagerank_score': score,
                'query_similarity': query_similarities[doc_idx],
                'rank': rank + 1
            })
        
        return result

5. 实时自适应排序

5.1 基于用户反馈的动态排序

class AdaptiveRanker:
    def __init__(self, learning_rate=0.1):
        self.learning_rate = learning_rate
        self.user_preferences = {}
        self.click_through_rates = {}
        self.feature_weights = {
            'semantic_similarity': 0.4,
            'keyword_match': 0.3,
            'user_preference': 0.2,
            'ctr': 0.1
        }
    
    def update_user_preference(self, user_id, query, clicked_docs, shown_docs):
        """根据用户点击行为更新偏好"""
        if user_id not in self.user_preferences:
            self.user_preferences[user_id] = {}
        
        # 更新点击率
        for doc in shown_docs:
            doc_key = hash(doc)
            if doc_key not in self.click_through_rates:
                self.click_through_rates[doc_key] = {'clicks': 0, 'shows': 0}
            
            self.click_through_rates[doc_key]['shows'] += 1
            if doc in clicked_docs:
                self.click_through_rates[doc_key]['clicks'] += 1
        
        # 更新用户偏好（简化版本）
        query_key = hash(query)
        if query_key not in self.user_preferences[user_id]:
            self.user_preferences[user_id][query_key] = {}
        
        for doc in clicked_docs:
            doc_key = hash(doc)
            if doc_key not in self.user_preferences[user_id][query_key]:
                self.user_preferences[user_id][query_key][doc_key] = 0
            
            self.user_preferences[user_id][query_key][doc_key] += self.learning_rate
    
    def get_user_preference_score(self, user_id, query, document):
        """获取用户偏好分数"""
        if user_id not in self.user_preferences:
            return 0
        
        query_key = hash(query)
        doc_key = hash(document)
        
        return self.user_preferences[user_id].get(query_key, {}).get(doc_key, 0)
    
    def get_ctr_score(self, document):
        """获取点击率分数"""
        doc_key = hash(document)
        if doc_key not in self.click_through_rates:
            return 0
        
        stats = self.click_through_rates[doc_key]
        if stats['shows'] == 0:
            return 0
        
        return stats['clicks'] / stats['shows']
    
    def rank_documents(self, query, documents, query_embedding=None, 
                      doc_embeddings=None, user_id=None, top_k=10):
        """自适应文档排序"""
        scores = []
        
        for i, doc in enumerate(documents):
            score = 0
            
            # 语义相似度
            if query_embedding is not None and doc_embeddings is not None:
                semantic_sim = cosine_similarity(
                    query_embedding.reshape(1, -1),
                    doc_embeddings[i].reshape(1, -1)
                )[0][0]
                score += self.feature_weights['semantic_similarity'] * semantic_sim
            
            # 关键词匹配
            query_words = set(query.lower().split())
            doc_words = set(doc.lower().split())
            keyword_score = len(query_words.intersection(doc_words)) / len(query_words) if query_words else 0
            score += self.feature_weights['keyword_match'] * keyword_score
            
            # 用户偏好
            if user_id:
                user_pref_score = self.get_user_preference_score(user_id, query, doc)
                score += self.feature_weights['user_preference'] * user_pref_score
            
            # 点击率
            ctr_score = self.get_ctr_score(doc)
            score += self.feature_weights['ctr'] * ctr_score
            
            scores.append((doc, score))
        
        # 排序
        scores.sort(key=lambda x: x[1], reverse=True)
        
        return [
            {
                'document': doc,
                'score': score,
                'rank': i + 1
            }
            for i, (doc, score) in enumerate(scores[:top_k])
        ]

6. 集成排序框架

6.1 多模型集成排序器

class EnsembleRanker:
    def __init__(self):
        self.rankers = {}
        self.weights = {}
    
    def add_ranker(self, name, ranker, weight=1.0):
        """添加排序器"""
        self.rankers[name] = ranker
        self.weights[name] = weight
    
    def rank_documents(self, query, documents, top_k=10, **kwargs):
        """集成多个排序器的结果"""
        all_rankings = {}
        
        # 获取每个排序器的结果
        for name, ranker in self.rankers.items():
            try:
                rankings = ranker.rank_documents(query, documents, top_k=len(documents), **kwargs)
                all_rankings[name] = rankings
            except Exception as e:
                print(f"Ranker {name} failed: {e}")
                continue
        
        if not all_rankings:
            return []
        
        # 计算加权平均分数
        doc_scores = {}
        for doc in documents:
            doc_scores[doc] = 0
            total_weight = 0
            
            for name, rankings in all_rankings.items():
                weight = self.weights[name]
                
                # 找到该文档在当前排序中的分数
                doc_score = 0
                for rank_info in rankings:
                    if rank_info['document'] == doc:
                        doc_score = rank_info.get('score', 0)
                        break
                
                doc_scores[doc] += weight * doc_score
                total_weight += weight
            
            if total_weight > 0:
                doc_scores[doc] /= total_weight
        
        # 排序并返回结果
        sorted_docs = sorted(doc_scores.items(), key=lambda x: x[1], reverse=True)
        
        return [
            {
                'document': doc,
                'ensemble_score': score,
                'rank': i + 1
            }
            for i, (doc, score) in enumerate(sorted_docs[:top_k])
        ]

# 使用示例
def create_ensemble_ranker():
    """创建集成排序器示例"""
    ensemble = EnsembleRanker()
    
    # 添加不同的排序器
    ensemble.add_ranker('cross_encoder', CrossEncoderRanker(), weight=0.4)
    ensemble.add_ranker('bi_encoder', BiEncoderRanker(), weight=0.3)
    ensemble.add_ranker('multi_factor', MultiFactorRanker(), weight=0.3)
    
    return ensemble

7. 性能优化技巧

7.1 批量处理和缓存

import functools
from functools import lru_cache
import hashlib

class OptimizedRanker:
    def __init__(self, cache_size=1000):
        self.cache_size = cache_size
        self.embedding_cache = {}
    
    @lru_cache(maxsize=1000)
    def cached_similarity(self, query_hash, doc_hash):
        """缓存相似度计算结果"""
        # 这里应该是实际的相似度计算
        pass
    
    def get_query_hash(self, query):
        """生成查询的哈希值"""
        return hashlib.md5(query.encode()).hexdigest()
    
    def get_doc_hash(self, document):
        """生成文档的哈希值"""
        return hashlib.md5(document.encode()).hexdigest()
    
    def batch_rank_documents(self, queries, documents_list, top_k=10):
        """批量处理多个查询"""
        results = []
        
        # 批量编码所有唯一的查询和文档
        unique_queries = list(set(queries))
        all_documents = list(set([doc for docs in documents_list for doc in docs]))
        
        # 这里可以使用批量编码来提高效率
        # query_embeddings = self.model.encode(unique_queries)
        # doc_embeddings = self.model.encode(all_documents)
        
        for i, (query, documents) in enumerate(zip(queries, documents_list)):
            # 使用预计算的嵌入进行排序
            ranking = self.rank_single_query(query, documents, top_k)
            results.append(ranking)
        
        return results

总结

这些排序方法各有优缺点：

基础方法（余弦相似度、欧几里得距离）：计算简单，适合实时场景
深度学习方法（Cross-Encoder、Bi-Encoder）：效果好但计算开销大
混合方法：平衡多个因素，更全面但复杂度高
高级策略（MMR、图排序）：考虑多样性和文档间关系
自适应方法：能够学习用户偏好，持续改进

在实际应用中，建议：

先用简单方法建立基线
根据业务需求选择合适的排序策略
使用A/B测试验证效果
考虑计算资源和响应时间的平衡
实施缓存和批量处理来优化性能

使用案例解释

1. query (查询文本)

类型: str
示例: "人工智能在医疗领域有哪些应用？"
特点: 用户的原始问题，通常较短(10-100字符)
作用: 表达用户的信息需求

2. documents (候选文档列表)

类型: List[str]
示例:

documents = [
    "人工智能在医疗诊断中发挥重要作用，通过机器学习算法...",
    "医疗AI还广泛应用于药物发现领域，通过深度学习模型...",
    "AI在医疗健康管理中的应用包括个性化治疗方案制定..."
]

特点: 来自初步检索的候选文档，需要重新排序
长度: 通常每个文档几十到几百个字符

3. query_embedding (查询嵌入向量)

类型: np.ndarray 或 torch.Tensor
形状: (768,) 或 (384,) 等，取决于模型
示例: array([0.1234, -0.5678, 0.9012, ...])
特点: 查询文本的数值化向量表示，包含语义信息
生成方式: 通过BERT、Sentence-BERT等模型编码得到

4. doc_embeddings (文档嵌入向量矩阵)

类型: np.ndarray 或 torch.Tensor
形状: (文档数量, 向量维度) 如 (5, 768)
示例:

doc_embeddings = array([
    [0.1111, -0.2222, 0.3333, ...],  # 文档1的向量
    [0.4444, -0.5555, 0.6666, ...],  # 文档2的向量
    [0.7777, -0.8888, 0.9999, ...]   # 文档3的向量
])

特点: 所有候选文档的向量表示矩阵

数据流转过程

输入阶段: 接收query文本和documents列表
编码阶段: 将文本转换为query_embedding和doc_embeddings
计算阶段: 计算查询向量与文档向量的相似度
排序阶段: 根据相似度分数重新排序文档
输出阶段: 返回排序后的文档列表

为什么需要这4个参数？

query + documents: 提供原始文本，便于最终展示和理解
query_embedding + doc_embeddings: 提供数值化表示，便于计算相似度

这种设计既保留了文本的可读性，又利用了向量的计算效率，是RAG系统中的标准做法。不同的排序算法可能只使用其中部分参数，但这4个参数涵盖了大多数排序方法的需求。

男士护肤品哪个牌子好？十大男士护肤品排行榜高省APP珊珊
很多男生意识到护肤的必要性，开始着手护肤，但不知道该选哪个男士护肤品品牌使用好。目前市面上很多男士护肤品品牌，可谓琳琅满目，让人眼花缭乱。男士挑选护肤品时，根据自己皮肤需求去正规渠道挑选合适的知名护肤品比较放心靠谱。高省APP，是2021年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入
《玉骨遥》：大司命为什么不杀朱颜？原因没那么简单 windy天意晚晴
《玉骨遥》里，朱颜就是时影的命劫之人。重明与时影早就知道，他们一直瞒着大司命，如今大司命也知道了真相。可是大司命却没有杀朱颜，而是给朱颜下了诛心咒，还说时影的命劫已经破了，真的如此吗？1、计划总是赶不上变化的大司命从目前剧情来说，大司命还不如时影，他信心十足的事情总会有纰漏。他不让时影见命劫之女，结果时影还是遇上了。他想让时影走火入魔，一心复仇，结果时影在朱颜的劝说下放下了仇恨。大司命让时影开山收
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
JVM 内存模型深度解析：原子性、可见性与有序性的实现练习时长两年半的程序员小胡 JVM 深度剖析：从面试考点到生产实践 jvm java 内存模型
在了解了JVM的基础架构和类加载机制后，我们需要进一步探索Java程序在多线程环境下的内存交互规则。JVM内存模型（JavaMemoryModel，JMM）定义了线程和主内存之间的抽象关系，它通过规范共享变量的访问方式，解决了多线程并发时的数据一致性问题。本文将从内存模型的核心目标出发，详解原子性、可见性、有序性的实现机制，以及volatile、synchronized等关键字在其中的作用。一、J
Flowable 实战落地核心：选型决策与坑点破解练习时长两年半的程序员小胡 Flowable 流程引擎实战指南低代码 BPMN 流程引擎 flowable 后端 java
在企业级流程引擎的落地过程中，选型的准确性和坑点的预见性直接决定项目成败。本文聚焦Flowable实战中最关键的“选型决策”与“常见坑点”，结合真实项目经验，提供可落地的解决方案。一、流程引擎选型：从业务本质出发1.1选型的三大核心维度企业在选择流程引擎时，需避免陷入“技术崇拜”，应回归业务本质。评估Flowable是否适用，可从三个维度判断：业务复杂度若流程涉及动态审批链（如按金额自动升级审批）
SpringMVC的执行流程
1、什么是MVCMVC是一种设计模式。MVC的原理图如下所示M-Model模型（完成业务逻辑：有javaBean构成，service+dao+entity）V-View视图（做界面的展示jsp，html……）C-Controller控制器（接收请求—>调用模型—>根据结果派发页面2、SpringMVC是什么SpringMVC是一个MVC的开源框架，SpringMVC=Struts2+Spring，
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
今晚吃太饱了爱伤心的蚂蚁
今晚吃太饱了，两碗干饭，两碗肉汤，一碗牛奶银耳汤，感觉肚子都顶出来了，圆滚滚的！明早要早起，出发去小蚂蚁家！看着剩下的肉汤，倒掉多可惜，干掉了！看着小蚂蚁熬的银耳汤，倒掉多可惜，于是热了一下，顺便热袋牛奶倒进去，大娃喝点，小蚂蚁喝点，还剩下一大碗，继续干掉！吃的太饱，人也懒洋洋的，躺床上不想动，感受的肚子撑撑的感觉，好久没吃这么饱了！这一晚灌的都是汤汤水水的，天冷的晚上，半夜要睡不安稳咯！哈哈！小
你对待万事万物的态度行靜
昨晚爸爸把洒水壶灌满水，对我说：你也该去浇浇你阳台上的花咯。这么大的天气，几天没浇水都快死了。我才意识到自己容易突然间忽视一些事情。尤其是身旁的一些事，可能它们呆久了，反而习以为常。想想每天的生活状态就是在不断的重复着一些事，有点固定模式。没有什么特别发生。记录我的一天：上班，挤公交，用手机或电脑，吃饭，上课。没有
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
承德十大亲子鉴定医院名单(附2024年10所正规医院) 国医基因陈主任
承德哪家医院可以做亲子鉴定？承德市中心医院、中国人民解放军第二六六医院、承德医学院附属医院等都可以做常规亲子鉴定采样采集，一般的医院并不可以为你提供常规亲子鉴定检测的服务。承德亲子鉴定中心地址：承德市西大街路北11号（承德国医基因）。一般只有少数三甲医院可以做亲子鉴定采样，或者当地亲子鉴定中心可以做亲子鉴定。如果想做亲子鉴定，最好直接到亲子鉴定中心内或亲子鉴定医院采样点内进行双方抽血鉴定，这样会更
践行8.0~第六周11.25-12.02 初队长
突破后的喜悦最可怕的不是自己不清楚，而是自己清楚了，却依然不心动，我想这就是我们每个人的惰性存在，在这一周的践行，我发现自己依然是停留在自己的模式当中，不断的恶性的轮回，虽然的话，那再晨间日记方面是纸质的填写，但是对一天的工作没有起到应有的计划和推动的作用而我自己呢，也有些时候的话会处于一个相对来讲放松的一个状态，时间的把控的话也有一些点的消极，所以在这周的间隙，重点是关注自己的三大目标为目标来进
5G基站信号加速器！AD8021ARZ-REEL7亚德诺超低噪声高速电压放大器专利失真消除技术! 深圳市尚想信息技术有限公司 5G通信高速运放 ADI黑科技 8K视频医疗超声
AD8021ARZ-REEL7ADI：重新定义高速放大器的性能极限！一、产品简介AD8021ARZ-REEL7是ADI（亚德诺半导体）推出的超低噪声高速电压反馈放大器，采用XFCB工艺和专利失真消除技术，专为4K/8K视频处理、医疗成像、5G通信等超高频应用设计。以1.8GHz带宽和0.1nV/√Hz超低噪声，成为高速信号调理的终极解决方案！二、五大颠覆性优势军工级信号保真度1.8GHz-3dB带
打造自己的梦想生态系统轻风style
今天听了第5周5.1的梦想系统和随堂练习：梦想仓库与八大关注表。参照老师给出的例子，列出了八大关注对应的自己的梦想。有些写的时候内心都在怀疑，但因为老师有说到，要没有分别心的去列出，不管是近的，远的，小的，大的，自己觉得可以实现的，或者觉得根本不可能实现的，都统统的列出来。就像音频中提到的，林语堂说过的话，梦想无论怎样模糊，总潜伏在我们心底，使我们的心境永远得不到宁静，直到这些梦想成为事实才止；像
我是孩子妈妈，我会让孩子饿着吗？松玲子
回老家过年，就是一场在关于喂养孩子问题上与老人的巅峰对决。前天我们回老家了，他爷爷奶奶就说孩子瘦了，就说我喂的不好，不按时喂，第一天夜里孩子总是睡一会就哭，睡一会就哭，夜里不知醒了多少次，弄得我真是几乎彻夜未眠。一大早，我还没起，我就听见他爷爷奶奶在外边说，今黑夜阳阳怎么老哭，是不是饿的，然后又延伸到我喂养的问题上，说不吃盐不行，不吃盐孩子没劲，吃蛋光吃个蛋黄，吃不饱，给他吃全蛋就行，哎呀我去，我
心力践行营十二期一阶学习打卡 LX_王彤彤
姓名：王彤彤时间：2021年4月24日一：朗读师父的十大人生哲学二：师父的早安分享感悟很喜欢这句话：所有的行动都是基于目标的尝试，没有所谓的失败，只是不同尝试后得到的不同结果，让我们更好地调整下一次的行动。三：感恩日记1.我太幸福了，我很感恩姑姑，因为姑姑放假又投喂了我，还给我带了饺子回家，这让我感觉很幸福。谢谢，谢谢，谢谢。2.我太幸福了，我很感恩师父晚上的直播，因为听他的分享我知道怎么更好的去
为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
京东中秋节会打折吗？京东中秋节活动力度大吗？高省APP珊珊
京东中秋节会打折，并且活动力度通常是比较大的。以下是具体分析：京东中秋节打折情况降价促销：京东在中秋节期间会推出大规模的降价促销活动，涵盖食品、家居、家电等多个品类，以及众多热门品牌。消费者可以在此期间享受到实实在在的降价优惠。多种优惠形式：除了直接的降价促销，京东还会通过满减优惠、折扣促销、限时秒杀等多种形式的优惠活动来吸引消费者。这些优惠活动通常具有较高的吸引力，能够激发消费者的购买欲望。目前
Android 应用权限管理详解
文章目录1.权限类型2.权限请求机制3.权限组和分级4.权限管理的演进5.权限监控和SELinux强制访问控制6.应用权限审核和GooglePlayProtect7.开发者最佳实践8.用户权限管理9.Android应用沙箱模型10.ScopedStorage（分区存储）11.背景位置权限（BackgroundLocationAccess）12.权限回收和自动清理13.权限请求的用户体验设计14.G
AI模型训练中过拟合和欠拟合的区别是什么？ workflower 人工智能算法人工智能数据分析
在AI模型训练中，过拟合和欠拟合是两种常见的模型性能问题，核心区别在于模型对数据的学习程度和泛化能力：欠拟合（Underfitting）-定义：模型未能充分学习到数据中的规律，对训练数据的拟合程度较差，在训练集和测试集上的表现都不好（如准确率低、损失值高）。-原因：-模型结构过于简单（如用线性模型解决非线性问题）；-训练数据量不足或特征信息不充分；-训练时间太短，模型尚未学到有效模式。-表现：训练
农场种蔬菜赚钱小游戏有哪些五大可以赚钱的小游戏APP 氧惠帮朋友一起省
喜欢种菜吗？我特意带来农场种蔬菜赚钱小游戏排行榜2022，线上汇集了超多模拟种菜玩法，玩家可以免费种植赚钱哦！每天都有大量的种植任务，线上完成就能赚钱哦！快来下载吧！1.氧惠APP购物、看电影、点外卖、用氧惠APP！更优惠！氧惠（全网优惠上氧惠）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面，送1:1超级补贴(邀请好友自购多少，你就推广得多少，非常厉害)，欢迎各位
严重的DDoS 攻击澳大利亚主要宽带提供商 Fancy1816575412
本周早些时候，澳大利亚最大的固定无线宽带运营商CirrusCommunications遭受了一次重大的DDoS攻击，导致其一半以上的网络瘫痪。该公司在其网站上声称：“强大的架构、数百个传输站点以及光纤和微波回程的使用使其能够以非常高的正常运行时间提供高速”。CirrusCommunications表示，它覆盖了澳大利亚十大人口中心以及几个主要的区域中心，主要为企业和政府客户提供服务。然而，据The
3次创业身价百亿，2年前却被大众判“死刑”，李想如今怎样了？职心眼儿
他，19岁放弃高考去创业；25岁，成为亿万富豪，被央视评为“80后创业”领军人物；39岁，身价再次暴涨，一夜间闯过200亿大关。他，在3个领域连续创业20年，一家公司市值700亿，一家公司市值2000亿。而他的最高学历，却只有高中。这个人，就是理想汽车的创始人——李想。纵观李想的创业史，可谓是颇为传奇：一个既没背景，又没资金高中毕业生，怎么就让3位互联网巨头（张一鸣、王兴、程维）同时为自己站台？更
【备孕故事】她一直想做个大差不离的人，没想到在这件事上拔了尖儿宜嘉阿姨
图片发自App杨婷说从小到大自己就是个中规中矩的人，不出格，不落单，一直随着大流。学业上从未出类拔萃，却也跟着大部队一起考上了一本；做事从不冒尖，搞个大差不离就行，因此，这么多年以来，差不多就行成了她对自己人生的要求。22岁大学毕业进了一家国企，外型不出挑但文静可人的她也遇上了两位追求者，简单的观察和交往后，她从中选了李广作为自己的婚恋对象。25岁那年，在父母亲朋的祝福声中杨婷和李广步入了婚姻。婚
黛玉葬花是一种什么心情爱的生命力
图片发自App小区里的花终于开了，带着孩子在小区散步的时候，无意间我注意到了玉兰，第一次我发现原来它是先开花后长叶子的，洁白如玉的花高耸入云，那种洁白，让人敬畏。因为有风，所以带孩子在楼遮挡的草坪上玩，发现紫叶李的花也开了，并且随着风的吹动，落了满地，孩子捡起一朵花，拿到我面前，细声细气的说“花”，我的大脑细胞瞬间激活，为什么不和孩子一起捡花呢！这可是一项好玩的游戏，于是我给孩子拿了一个大的挖土用
Anaconda 和 Miniconda：功能详解与选择建议古月฿ python入门 python conda
Anaconda和Miniconda详细介绍一、Anaconda的详细介绍1.什么是Anaconda？Anaconda是一个开源的包管理和环境管理工具，在数据科学、机器学习以及科学计算领域发挥着关键作用。它以Python和R语言为基础，为用户精心准备了大量预装库和工具，极大地缩短了搭建数据科学环境的时间。对于那些想要快速开展数据分析、模型训练等工作的人员来说，Anaconda就像是一个一站式的“数
今天的彭格列依然被世界游戏吓得瑟瑟发抖呢云染舒倦
前言有一天，有一个白兰的大魔王想要毁灭世界，创世者非常不高兴，于是，创始者用吞噬一切，包容一切的大空（泽田纲吉）、捉摸不定的雾（六道骸）、孤高的浮云（云雀恭弥）、愤怒的忠岚（狱寺隼人）、晕染一切的雨（山本武）、守护之雷（蓝波）、热血之晴（晴川了平）创造了七位拯救世界的勇士（用属性制造勇士），让他们跟白兰对抗。。。［白兰的力量是游戏，于是要打败他，只要同样在世界布置的游戏中，赢过白兰就行了~］图片发
MySQL复习题
一.填空题1.关系数据库的标准语言是SQL。2.数据库发展的3个阶段中，数据独立性最高的是阶段数据库系统。3.概念模型中的3种基本联系分别是一对一、一对多和多对多。4.MySQL配置文件的文件名是my.ini或my.cnf。5.在MySQL配置文件中，datadir用于指定数据库文件的保存目录。6.添加IFNOTEXISTS可在创建的数据库已存在时防止程序报错。7.MySQL提供的SHOWCREA
Qwen3 大模型实战：使用 vLLM 部署与函数调用（Function Call）全攻略曦紫沐大模型大模型部署 Qwen3 vLLM 函数调用
文章摘要本文将带你从零开始，深入掌握如何使用Qwen3-8B大语言模型，结合vLLM进行高性能部署，并通过函数调用（FunctionCall）实现模型与外部工具的智能联动。我们将详细讲解部署命令、调用方式、代码示例及实际应用场景，帮助你快速构建基于Qwen3的智能应用。一、Qwen3简介与部署环境准备Qwen3是通义千问系列的最新一代大语言模型，具备强大的自然语言理解和生成能力，尤其在函数调用、工
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分