凡人的AI工具箱

PyTorch深度学习框架60天进阶学习计划 - 第28天：多模态模型实践（二）

5. 跨模态检索系统应用场景

5.1 图文匹配系统的实际应用

应用领域	具体场景	优势
电子商务	商品图像搜索、视觉购物	用户可以上传图片查找相似商品或使用文本描述查找商品
智能媒体	内容推荐、图片库搜索	通过内容的语义理解提供更精准的推荐和搜索
社交网络	基于内容的帖子推荐	理解用户兴趣，提供更相关的内容推荐
教育技术	多模态教学资源检索	教师和学生可以更容易地找到相关的教学资源
健康医疗	医学图像与病例描述匹配	帮助医生检索相似病例，辅助诊断
智能驾驶	场景理解与指令匹配	将用户指令与视觉场景进行匹配，提高交互体验
安防监控	基于文本描述的目标检索	通过文字描述快速定位监控画面中的目标
内容创作	AI辅助创作工具	为创作者提供相关的视觉或文本素材

5.2 CLIP在零样本场景中的应用

CLIP模型的一个重要特性是其强大的零样本识别能力。我们可以利用这一特性来实现多种有趣的应

5.2 CLIP在零样本场景中的应用

CLIP模型的一个重要特性是其强大的零样本识别能力。我们可以利用这一特性来实现多种有趣的应用，而无需为特定任务收集和标注大量数据：

开放词汇图像分类：传统图像分类模型只能识别训练时见过的有限类别，而CLIP可以通过文本提示识别任意类别的图像。
视觉问答：将问题转换为一系列文本提示，然后将图像与这些提示进行匹配，选择最相似的作为答案。
细粒度识别：通过精心设计的文本提示，可以实现对细微特征的区分。
域适应：CLIP表现出惊人的域适应能力，可以应用于涂鸦、素描等与自然图像风格差异较大的图像。

下面是一个简单的零样本分类示例：

import torch
import torch.nn.functional as F
from torchvision import transforms
from PIL import Image
import matplotlib.pyplot as plt
import numpy as np

# 导入自定义CLIP模型
from clip_model import CLIP

class ZeroShotClassifier:
    def __init__(self, model_path, device='cuda' if torch.cuda.is_available() else 'cpu'):
        """
        初始化零样本分类器
        Args:
            model_path: CLIP模型路径
            device: 使用的设备
        """
        self.device = device
        self.model = CLIP(embed_dim=512).to(device)
        
        # 加载预训练权重
        self.model.load_state_dict(torch.load(model_path, map_location=device))
        self.model.eval()
        
        # 初始化BERT分词器
        from transformers import BertTokenizer
        self.tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
        
        # 图像转换
        self.transform = transforms.Compose([
            transforms.Resize((224, 224)),
            transforms.ToTensor(),
            transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
        ])
    
    def classify(self, image_path, class_names, template="a photo of a {}"):
        """
        对图像进行零样本分类
        Args:
            image_path: 图像路径
            class_names: 类别名称列表
            template: 提示模板
        Returns:
            probabilities: 各类别的概率
            top_class: 概率最高的类别
        """
        # 加载并处理图像
        image = Image.open(image_path).convert('RGB')
        image_tensor = self.transform(image).unsqueeze(0).to(self.device)
        
        # 创建文本提示
        text_prompts = [template.format(class_name) for class_name in class_names]
        
        # 编码文本
        encodings = self.tokenizer(
            text_prompts,
            padding='max_length',
            truncation=True,
            max_length=64,
            return_tensors='pt'
        )
        
        input_ids = encodings['input_ids'].to(self.device)
        attention_mask = encodings['attention_mask'].to(self.device)
        
        # 计算图像和文本特征
        with torch.no_grad():
            image_features = self.model.encode_image(image_tensor)
            text_features = self.model.encode_text(input_ids, attention_mask)
        
        # 计算相似度
        image_features = image_features.cpu()
        text_features = text_features.cpu()
        
        # 使用余弦相似度
        similarities = F.cosine_similarity(image_features, text_features)
        
        # 转换为概率
        probabilities = F.softmax(similarities, dim=0)
        
        # 获取最高概率的类别
        top_idx = probabilities.argmax().item()
        top_class = class_names[top_idx]
        
        return probabilities.tolist(), top_class
    
    def visualize_classification(self, image_path, class_names, template="a photo of a {}"):
        """
        可视化零样本分类结果
        Args:
            image_path: 图像路径
            class_names: 类别名称列表
            template: 提示模板
        """
        # 获取分类结果
        probabilities, top_class = self.classify(image_path, class_names, template)
        
        # 加载图像用于显示
        image = Image.open(image_path).convert('RGB')
        
        # 创建可视化
        plt.figure(figsize=(12, 5))
        
        # 显示图像
        plt.subplot(1, 2, 1)
        plt.imshow(image)
        plt.title(f"Predicted: {top_class}")
        plt.axis('off')
        
        # 显示概率条形图
        plt.subplot(1, 2, 2)
        indices = np.argsort(probabilities)[::-1]
        
        plt.barh(range(len(class_names)), [probabilities[i] for i in indices])
        plt.yticks(range(len(class_names)), [class_names[i] for i in indices])
        plt.xlabel('Probability')
        plt.title('Zero-Shot Classification Probabilities')
        plt.tight_layout()
        plt.savefig('zero_shot_classification.png')
        plt.show()

# 使用示例
def demo_zero_shot_classification():
    # 初始化零样本分类器
    classifier = ZeroShotClassifier(model_path='best_clip_model.pth')
    
    # 定义类别
    class_names = ["cat", "dog", "car", "flower", "bird", "book", "building", "tree", "person"]
    
    # 分类图像
    image_path = "dummy_images/image_0.jpg"  # 替换为测试图像路径
    classifier.visualize_classification(image_path, class_names)
    
    # 使用不同模板
    templates = [
        "a photo of a {}",
        "a painting of a {}",
        "a sketch of a {}",
        "a {} in the wild",
        "a close-up photo of a {}"
    ]
    
    # 测试不同模板的影响
    results = {}
    for template in templates:
        probabilities, top_class = classifier.classify(image_path, class_names, template)
        results[template] = (probabilities, top_class)
    
    # 打印结果
    for template, (probabilities, top_class) in results.items():
        print(f"Template: '{template}'")
        print(f"Top class: {top_class}")
        print(f"Top probability: {max(probabilities):.4f}")
        print("")
    
    return results

if __name__ == "__main__":
    demo_zero_shot_classification()

6. 多模态模型的高级技术与优化

6.1 提示工程对CLIP性能的影响

提示工程（Prompt Engineering）是指通过精心设计文本提示来优化CLIP等多模态模型的性能。有效的提示可以显著提高模型的准确性，尤其是在零样本场景中。

提示模板设计表

提示模板类型	示例	适用场景
基础描述型	“a photo of a {}”	一般分类任务
细节增强型	“a close-up photo of a {}”	需要关注细节的任务
上下文提供型	“a {} in the wild”	强调自然环境中的对象
风格指定型	“a painting of a {}”	艺术风格识别
多样化表述	[“a {}”, “the {}”, “photo of a {}”]	提高鲁棒性
域特定型	“a medical image of a {}”	特定领域的任务
任务导向型	“is this a {}? yes or no”	二分类任务
对比提示型	“a photo of a {}, not a {}”	容易混淆的类别

6.2 多模态特征融合技术

除了CLIP中使用的对比学习，还有多种方法可以融合不同模态的特征：

6.3 模型蒸馏与压缩

训练大型多模态模型通常需要大量计算资源，为了实际部署，我们可以使用知识蒸馏（Knowledge Distillation）技术将大模型的知识转移到更小的模型中：

import torch
import torch.nn as nn
import torch.nn.functional as F
from torchvision import models
from transformers import BertModel

# 定义一个轻量级的图像编码器
class LightImageEncoder(nn.Module):
    def __init__(self, embed_dim=512):
        super().__init__()
        # 使用更轻量的ResNet18替代ResNet50
        self.model = models.resnet18(pretrained=True)
        # 移除最后的分类层
        self.model.fc = nn.Identity()
        # 添加投影层
        self.projection = nn.Linear(512, embed_dim)
        
    def forward(self, x):
        features = self.model(x)
        projected_features = self.projection(features)
        return F.normalize(projected_features, p=2, dim=1)

# 定义一个轻量级的文本编码器
class LightTextEncoder(nn.Module):
    def __init__(self, embed_dim=512):
        super().__init__()
        # 使用小型BERT模型或自定义编码器
        # 这里我们使用6层Transformer编码器作为例子
        
        # 嵌入层
        self.embedding = nn.Embedding(30522, 384)  # 与BERT词汇表大小相同
        
        # 编码器层（简化的Transformer）
        encoder_layer = nn.TransformerEncoderLayer(
            d_model=384,
            nhead=6,
            dim_feedforward=1024,
            dropout=0.1,
            activation='gelu',
            batch_first=True
        )
        self.encoder = nn.TransformerEncoder(encoder_layer, num_layers=6)
        
        # 投影层
        self.projection = nn.Linear(384, embed_dim)
        
    def forward(self, input_ids, attention_mask):
        # 词嵌入
        embeddings = self.embedding(input_ids)
        
        # 创建注意力掩码（扩展维度以适应Transformer）
        extended_attention_mask = attention_mask.unsqueeze(1).unsqueeze(2)
        extended_attention_mask = (1.0 - extended_attention_mask) * -10000.0
        
        # 通过编码器
        hidden_states = self.encoder(embeddings, src_key_padding_mask=(attention_mask == 0))
        
        # 使用[CLS]令牌或平均池化
        # 这里我们使用[CLS]令牌（第一个令牌）
        cls_token = hidden_states[:, 0, :]
        
        # 投影到目标维度
        projected_features = self.projection(cls_token)
        
        return F.normalize(projected_features, p=2, dim=1)

# 定义蒸馏后的轻量级CLIP模型
class LightCLIP(nn.Module):
    def __init__(self, embed_dim=512, temperature=0.07):
        super().__init__()
        self.image_encoder = LightImageEncoder(embed_dim)
        self.text_encoder = LightTextEncoder(embed_dim)
        self.temperature = temperature
        self.logit_scale = nn.Parameter(torch.ones([]) * np.log(1 / temperature))
        
    def forward(self, images, input_ids, attention_mask):
        image_features = self.image_encoder(images)
        text_features = self.text_encoder(input_ids, attention_mask)
        
        logit_scale = self.logit_scale.exp()
        logits_per_image = logit_scale * image_features @ text_features.t()
        logits_per_text = logits_per_image.t()
        
        return logits_per_image, logits_per_text
    
    def encode_image(self, images):
        return self.image_encoder(images)
    
    def encode_text(self, input_ids, attention_mask):
        return self.text_encoder(input_ids, attention_mask)

# 知识蒸馏损失
class DistillationLoss(nn.Module):
    def __init__(self, alpha=0.5, temperature=2.0):
        super().__init__()
        self.alpha = alpha  # 蒸馏损失权重
        self.temperature = temperature  # 蒸馏温度
        self.cross_entropy = nn.CrossEntropyLoss()
        
    def forward(self, student_logits, teacher_logits, labels=None):
        """
        计算蒸馏损失
        Args:
            student_logits: 学生模型的logits
            teacher_logits: 教师模型的logits
            labels: 真实标签（如果有）
        """
        # 蒸馏损失 - 让学生模型模仿教师模型的软标签
        distillation_loss = F.kl_div(
            F.log_softmax(student_logits / self.temperature, dim=1),
            F.softmax(teacher_logits / self.temperature, dim=1),
            reduction='batchmean'
        ) * (self.temperature ** 2)
        
        # 如果有真实标签，则计算硬标签损失
        if labels is not None:
            hard_loss = self.cross_entropy(student_logits, labels)
            # 组合蒸馏损失和硬标签损失
            return self.alpha * distillation_loss + (1 - self.alpha) * hard_loss
        else:
            return distillation_loss

# CLIP知识蒸馏训练器
class CLIPDistillationTrainer:
    def __init__(self, teacher_model, student_model, train_dataloader, val_dataloader=None,
                 device='cuda', lr=1e-4, weight_decay=0.01, epochs=10, 
                 alpha=0.5, temperature=2.0):
        """
        CLIP知识蒸馏训练器
        Args:
            teacher_model: 预训练好的教师模型（原始CLIP）
            student_model: 待训练的学生模型（轻量级CLIP）
            train_dataloader: 训练数据加载器
            val_dataloader: 验证数据加载器
            device: 训练设备
            lr: 学习率
            weight_decay: 权重衰减
            epochs: 训练轮数
            alpha: 蒸馏损失权重
            temperature: 蒸馏温度
        """
        self.teacher_model = teacher_model.to(device)
        self.student_model = student_model.to(device)
        self.train_dataloader = train_dataloader
        self.val_dataloader = val_dataloader
        self.device = device
        
        # 确保教师模型不需要梯度
        for param in self.teacher_model.parameters():
            param.requires_grad = False
        
        # 初始化优化器
        self.optimizer = torch.optim.Adam(
            student_model.parameters(), 
            lr=lr, 
            weight_decay=weight_decay
        )
        
        self.scheduler = torch.optim.lr_scheduler.CosineAnnealingLR(
            self.optimizer, 
            T_max=epochs
        )
        
        # 初始化蒸馏损失
        self.criterion = DistillationLoss(alpha=alpha, temperature=temperature)
        self.epochs = epochs
        
        # 跟踪指标
        self.train_losses = []
        self.val_losses = []
        self.best_val_loss = float('inf')
    
    def train_epoch(self):
        self.teacher_model.eval()  # 教师模型始终处于评估模式
        self.student_model.train()
        total_loss = 0
        
        for batch in tqdm(self.train_dataloader, desc='Training'):
            # 将数据移至设备
            images = batch['image'].to(self.device)
            input_ids = batch['input_ids'].to(self.device)
            attention_mask = batch['attention_mask'].to(self.device)
            
            # 获取教师模型的输出（无需梯度）
            with torch.no_grad():
                teacher_logits_i2t, teacher_logits_t2i = self.teacher_model(
                    images, input_ids, attention_mask
                )
            
            # 获取学生模型的输出
            student_logits_i2t, student_logits_t2i = self.student_model(
                images, input_ids, attention_mask
            )
            
            # 计算蒸馏损失
            loss_i2t = self.criterion(student_logits_i2t, teacher_logits_i2t)
            loss_t2i = self.criterion(student_logits_t2i, teacher_logits_t2i)
            loss = (loss_i2t + loss_t2i) / 2
            
            # 反向传播和优化
            self.optimizer.zero_grad()
            loss.backward()
            self.optimizer.step()
            
            total_loss += loss.item()
        
        avg_loss = total_loss / len(self.train_dataloader)
        self.train_losses.append(avg_loss)
        return avg_loss
    
    def validate(self):
        if self.val_dataloader is None:
            return None
        
        self.teacher_model.eval()
        self.student_model.eval()
        total_loss = 0
        
        with torch.no_grad():
            for batch in tqdm(self.val_dataloader, desc='Validating'):
                # 将数据移至设备
                images = batch['image'].to(self.device)
                input_ids = batch['input_ids'].to(self.device)
                attention_mask = batch['attention_mask'].to(self.device)
                
                # 获取教师模型的输出
                teacher_logits_i2t, teacher_logits_t2i = self.teacher_model(
                    images, input_ids, attention_mask
                )
                
                # 获取学生模型的输出
                student_logits_i2t, student_logits_t2i = self.student_model(
                    images, input_ids, attention_mask
                )
                
                # 计算蒸馏损失
                loss_i2t = self.criterion(student_logits_i2t, teacher_logits_i2t)
                loss_t2i = self.criterion(student_logits_t2i, teacher_logits_t2i)
                loss = (loss_i2t + loss_t2i) / 2
                
                total_loss += loss.item()
        
        avg_loss = total_loss / len(self.val_dataloader)
        self.val_losses.append(avg_loss)
        
        # 保存最佳模型
        if avg_loss < self.best_val_loss:
            self.best_val_loss = avg_loss
            torch.save(self.student_model.state_dict(), 'best_light_clip_model.pth')
        
        return avg_loss
    
    def train(self):
        print(f"Starting distillation training on {self.device}")
        
        for epoch in range(self.epochs):
            print(f"\nEpoch {epoch+1}/{self.epochs}")
            
            # 训练一个epoch
            train_loss = self.train_epoch()
            print(f"Training Loss: {train_loss:.4f}")
            
            # 验证
            if self.val_dataloader is not None:
                val_loss = self.validate()
                print(f"Validation Loss: {val_loss:.4f}")
            
            # 更新学习率
            self.scheduler.step()
            current_lr = self.scheduler.get_last_lr()[0]
            print(f"Learning Rate: {current_lr:.6f}")
        
        # 保存最终模型
        torch.save(self.student_model.state_dict(), 'final_light_clip_model.pth')
        print("Distillation training completed!")
        
        return self.train_losses, self.val_losses

# 模型大小和性能比较
def compare_models(teacher_model, student_model):
    # 计算参数量
    def count_parameters(model):
        return sum(p.numel() for p in model.parameters() if p.requires_grad)
    
    teacher_params = count_parameters(teacher_model)
    student_params = count_parameters(student_model)
    
    # 模型大小对比
    compression_ratio = teacher_params / student_params
    
    print(f"Teacher model parameters: {teacher_params:,}")
    print(f"Student model parameters: {student_params:,}")
    print(f"Compression ratio: {compression_ratio:.2f}x")
    
    # 测量推理速度
    device = next(teacher_model.parameters()).device
    
    # 创建示例输入
    batch_size = 16
    dummy_images = torch.randn(batch_size, 3, 224, 224).to(device)
    dummy_input_ids = torch.randint(0, 30000, (batch_size, 64)).to(device)
    dummy_attention_mask = torch.ones(batch_size, 64).to(device)
    
    # 测量教师模型速度
    teacher_model.eval()
    torch.cuda.synchronize()
    start_time = time.time()
    
    with torch.no_grad():
        for _ in range(10):
            _ = teacher_model(dummy_images, dummy_input_ids, dummy_attention_mask)
    
    torch.cuda.synchronize()
    teacher_time = (time.time() - start_time) / 10
    
    # 测量学生模型速度
    student_model.eval()
    torch.cuda.synchronize()
    start_time = time.time()
    
    with torch.no_grad():
        for _ in range(10):
            _ = student_model(dummy_images, dummy_input_ids, dummy_attention_mask)
    
    torch.cuda.synchronize()
    student_time = (time.time() - start_time) / 10
    
    speedup = teacher_time / student_time
    
    print(f"Teacher model inference time: {teacher_time*1000:.2f} ms")
    print(f"Student model inference time: {student_time*1000:.2f} ms")
    print(f"Speedup: {speedup:.2f}x")
    
    return {
        'teacher_params': teacher_params,
        'student_params': student_params,
        'compression_ratio': compression_ratio,
        'teacher_time': teacher_time,
        'student_time': student_time,
        'speedup': speedup
    }

7. 实战案例：构建图文匹配系统

让我们总结一下构建图文匹配系统的完整流程：

7.1 系统流程图

┌─────────────────┐     ┌─────────────────┐
│  图像数据收集     │     │  文本数据收集     │
└────────┬────────┘     └────────┬────────┘
         │                       │
         ▼                       ▼
┌─────────────────┐     ┌─────────────────┐
│  图像预处理       │     │  文本预处理      │
└────────┬────────┘     └────────┬────────┘
         │                       │
         ▼                       ▼
┌────────────────────────────────────────┐
│             CLIP模型训练                │
└────────────────────┬───────────────────┘
                     │
                     ▼
┌────────────────────────────────────────┐
│          特征索引构建                    │
└────────────────────┬───────────────────┘
                     │
          ┌──────────┴──────────┐
          │                     │
          ▼                     ▼
┌─────────────────┐     ┌─────────────────┐
│ 文本到图像搜索    │     │ 图像到文本搜索     │
└────────┬────────┘     └────────┬────────┘
         │                       │
         ▼                       ▼
┌─────────────────┐     ┌─────────────────┐
│  结果排序与展示   │     │  结果排序与展示    │
└─────────────────┘     └─────────────────┘

7.2 系统架构和性能优化

在实际部署中，我们需要考虑以下几个方面的优化：

优化方向	实现方法	收益
模型压缩	知识蒸馏、量化、剪枝	减小模型体积，提高推理速度
向量索引	FAISS、HNSW等近似最近邻搜索	加速大规模向量检索
批处理推理	将多个查询合并为一个批次处理	提高GPU利用率，降低延迟
缓存机制	缓存热门查询的结果	减少重复计算，提高响应速度
分布式部署	模型分片、负载均衡	提高系统容量和可靠性
渐进式加载	先返回初步结果，后续细化	提升用户体验

7.3 系统评估指标

评估图文匹配系统的性能时，可以使用以下指标：

指标	描述	计算方法
Recall@K	前K个结果中包含相关项的比例	相关项数 / 总相关项数
Precision@K	前K个结果中相关项的比例	相关项数 / K
Mean Reciprocal Rank	第一个相关项排名的倒数平均值	1 / rank
Mean Average Precision	各召回点精度的平均值	各级precision的平均
NDCG	考虑相关性等级的排序质量指标	根据相关性等级加权计算
延迟	查询响应时间	查询开始到返回结果的时间
吞吐量	单位时间内处理的查询数	每秒查询数（QPS）
资源利用率	系统资源使用情况	CPU/GPU/内存使用百分比
用户满意度	用户对搜索结果的满意程度	问卷调查、点击率等
多样性	结果的多样性程度	结果集中的信息熵
鲁棒性	对噪声和异常输入的抵抗力	在各种条件下的性能稳定性

8. 未来发展方向与进阶技术

随着多模态学习的快速发展，图文匹配系统也在不断演进。以下是一些值得关注的未来发展方向：

8.1 更先进的多模态架构

架构	特点	优势
ALIGN	对比噪声对的处理能力更强	能利用更嘈杂的网络数据
Florence	统一视觉表示学习	在多种下游任务上表现优异
FLAVA	联合掩码自回归预训练	同时学习视觉、语言和多模态表示
CoCa	对比与文本生成相结合	支持更丰富的图像理解任务
BLIP-2	引入Q-Former作为桥接层	更好地连接视觉编码器和大语言模型
CLIP-ViL	融合检测和分割能力	理解图像中的细粒度对象和区域

8.2 多模态指令微调与对齐

随着LLM的发展，多模态模型也逐渐采用指令微调（Instruction Tuning）技术来提高其与人类意图的对齐程度。典型的方法包括：

指令数据集构建：构建包含各种图文任务的指令数据集
多任务指令微调：同时在多种指令上进行微调，提高模型通用性
思维链提示：引导模型进行逐步推理，提高复杂任务的处理能力
对抗样本训练：使用对抗样本增强模型的鲁棒性和安全性
人类反馈的强化学习（RLHF）：利用人类偏好数据进一步对齐模型行为

8.3 多模态表示的可解释性

提高多模态表示的可解释性是当前研究的重要方向：

9. 实际应用中的挑战与解决方案

9.1 常见挑战及解决方案表

挑战	描述	解决方案
数据偏见	训练数据中的社会偏见会被模型学习	平衡数据集、偏见检测与缓解、公平性约束
域适应	模型在新领域表现下降	领域自适应训练、增量学习、领域特定微调
长尾分布	稀有类别表现不佳	重采样、重加权、解耦训练策略
推理效率	大型模型部署资源消耗大	模型压缩、知识蒸馏、量化、缓存机制
语义歧义	文本描述的模糊性与多义性	上下文增强、多样化提示、用户反馈优化
隐私安全	模型可能泄露训练数据信息	差分隐私、联邦学习、模型安全审计
鲁棒性	模型对对抗扰动敏感	对抗训练、一致性正则化、数据增强

9.2 实战经验分享

以下是一些在实际项目中积累的经验：

开始简单，循序渐进：从小数据集和简单模型开始，逐步扩展复杂度
建立强大的评估管道：设计全面的评估指标和测试集，及时发现问题
关注错误案例：分析模型失败的情况，从中总结改进方向
持续监控与更新：部署后持续监控模型性能，定期更新以适应分布变化
用户反馈闭环：建立机制收集和利用用户反馈来改进模型
考虑边缘场景：处理低质量输入、极端案例和潜在的对抗攻击
优化用户体验：不仅关注模型性能，也要考虑整体用户体验

10. 总结与学习路径

10.1 知识体系结构

通过今天的学习，我们构建了一个完整的多模态学习知识体系：

基础知识：多模态学习概念、CLIP架构原理
核心技术：对比学习、特征空间对齐、零样本识别
实践技能：PyTorch实现CLIP模型、构建图文检索系统
优化方法：困难负样本挖掘、提示工程、模型蒸馏
应用部署：系统架构设计、性能优化、评估指标
前沿方向：先进架构、指令微调、可解释性研究

10.2 进阶学习路径

阶段	学习内容	资源推荐
扎实基础	计算机视觉、自然语言处理基础	CS231n, CS224n课程
论文研读	CLIP, ALIGN, FLAVA等经典论文	arXiv, Papers with Code
实践项目	构建自己的图文检索系统	Hugging Face, GitHub开源项目
前沿探索	参与Kaggle竞赛、开源贡献	Kaggle, Hugging Face Spaces
社区互动	参与研讨会、分享经验	ML社区、学术会议

10.3 学习建议

理论与实践并重：不仅要理解算法原理，也要动手实现和调试
从小数据集开始：先在小型数据集上验证想法，再扩展到大规模数据
拥抱开源生态：充分利用PyTorch、Hugging Face等开源工具
关注应用场景：思考多模态模型如何解决实际问题
持续学习：多模态领域发展迅速，保持对新进展的关注

结语

恭喜你完成了多模态学习的进阶之旅！通过构建图文匹配系统和深入理解CLIP架构，你已经掌握了多模态学习的核心技术和实践方法。这些知识将帮助你在计算机视觉、自然语言处理和人工智能的交叉领域中开展更深入的研究和应用。

清华大学全五版的《DeepSeek教程》完整的文档需要的朋友，关注我私信：deepseek 即可获得。

怎么样今天的内容还满意吗？再次感谢朋友们的观看，关注GZH：凡人的AI工具箱，回复666，送您价值199的AI大礼包。最后，祝您早日实现财务自由，还请给个赞，谢谢！

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
x86-64汇编语言训练程序与实战十除以十等于一
本文还有配套的精品资源，点击获取简介：汇编语言是一种低级语言，与机器代码紧密相关，特别适用于编写系统级代码及性能要求高的应用。nasm编译器是针对x86和x86-64架构的汇编语言编译器，支持多种语法风格和指令集。项目Euler提供数学和计算机科学问题，鼓励编程技巧应用，前100个问题的答案可共享。x86-64架构扩展了寄存器数量并引入新指令，提升了数据处理效率。学习汇编语言能够深入理解计算机底层
三菱PLC全套学习资料及应用手册 good2know
本文还有配套的精品资源，点击获取简介：三菱PLC作为工业自动化领域的核心设备，其系列产品的学习和应用需要全面深入的知识。本次资料包为学习者提供从基础到进阶的全方位学习资源，包括各种型号PLC的操作手册、编程指南、软件操作教程以及实际案例分析，旨在帮助用户系统掌握PLC的编程语言、指令系统及在各类工业应用中的实施。1.三菱PLC基础知识入门1.1PLC的基本概念可编程逻辑控制器（PLC）是工业自动化
日更006 终极训练营day3 懒cici
人生创业课（2）今天的主题：学习方法一：遇到有用的书，反复读，然后结合自身实际，列践行清单，不要再写读书笔记思考这本书与我有什么关系，我在哪些地方能用到，之后我该怎么用方法二：读完书没映像怎么办?训练你的大脑，方法：每读完一遍书，立马合上书，做一场分享，几分钟都行对自己的学习要求太低，要逼自己方法三：学习深度不够怎么办？找到细分领域的榜样，把他们的文章、书籍、产品都体验一遍，成为他们的超级用户，向
9、汇编语言编程入门：从环境搭建到简单程序实现神经网络酱汇编语言 MEPIS GNU工具链
汇编语言编程入门：从环境搭建到简单程序实现1.数据存储介质问题解决在处理数据存储时，若要使用MEPIS系统，需确保有其可访问的存储介质。目前，MEPIS无法向采用NTFS格式（常用于Windows2000和XP工作站）的硬盘写入数据。不过，若硬盘采用FAT32格式，MEPIS就能进行写入操作。此外，MEPIS还能将文件写入软盘和大多数USB闪存驱动器。若工作站连接到局域网，还可通过FTP协议或挂载
day15｜前端框架学习和算法 universe_01 前端算法笔记
T22括号生成先把所有情况都画出来，然后（在满足什么情况下）把不符合条件的删除。T78子集要画树状图，把思路清晰。可以用暴力法、回溯法和DFS做这个题DFS深度搜索：每个边都走完，再回溯应用：二叉树搜索，图搜索回溯算法=DFS+剪枝T200岛屿数量（非常经典BFS宽度把树状转化成队列形式，lambda匿名函数“一次性的小函数，没有名字”setup语法糖：让代码更简洁好写的语法ref创建：基本类型的
《极简思维》第三部分小洋苏兮
整理你的人际关系如何改善人际关系？摘录：因为人际关系问题是人们生活中不快乐的主要原因。感想：感觉这个说的挺对，之前我总是埋头学习，不管舍友不管自己的合作伙伴的一些事情，但实际上，这学期关注了之后好多了摘录：“亲密关系与社交会让你健康而快乐。这是基础。太过于关注成就或不太关心人际关系的人都不怎么快乐。基本上来说，人类就是建立在人脉关系上的。”感想：但是如果有时想的太多就不太好，要以一个开放的心态跟别
你要记住，最重要的是:随时做好准备，为了你可能成为更好的自己，放弃现在的自己。霖霖z
打卡人:周云日期:2018年11月09日【日精进打卡第180天】【知～学习】《六项精进》0遍共214遍《通篇》1遍共106遍《大学》2遍共347遍《坚强工作，温柔生活》ok《不抱怨的世界》104-108页《经典名句》你要记住，最重要的是:随时做好准备，为了你可能成为更好的自己，放弃现在的自己。【行～实践】一、修身：（对自己个人）1、坚持打卡二、齐家：（对家庭和家人）打扫卫生，接送孩子，洗衣做饭，陪
贫穷家庭的孩子考上985以后会怎样？ Mellisa蜜思言
我出生在一个贫穷的农村家庭，据我妈说，我出生的时候才4斤多，而她生完我以后月子里就瘦到70斤。家里一直很穷，父母都是在菜市场卖菜的，家里还有几亩地种庄稼的。我很小开始就要去帮忙，暑假的生活就是帮忙去卖菜和割稻谷，那时候自己对于割稻谷这种事情有着莫名的恐惧，生怕自己长大以后还是每年都要过着割稻谷这种日子。父母因为忙于生计无暇顾及我的学习，幸好我因为看到他们这样子的生活，内心里有深深的恐惧感，驱使着我
英伟达靠什么支撑起了4万亿？AI泡沫还能撑多久？
英伟达市值突破4万亿美元，既是AI算力需求爆发的直接体现，也暗含市场对未来的狂热预期。其支撑逻辑与潜在风险并存，而AI泡沫的可持续性则取决于技术、商业与地缘政治的复杂博弈。⚙️一、英伟达4万亿市值的核心支撑因素技术垄断与生态壁垒硬件优势：英伟达GPU在AI训练市场占有率超87%，H100芯片的FP16算力达1979TFLOPS，领先竞品3-5倍。CUDA生态：400万开发者构建的软件护城河，成为A
Spring进阶 - SpringMVC实现原理之DispatcherServlet处理请求的过程倾听铃的声后端 spring java mvc 开发语言分布式
前文我们有了IOC的源码基础以及SpringMVC的基础，我们便可以进一步深入理解SpringMVC主要实现原理，包含DispatcherServlet的初始化过程和DispatcherServlet处理请求的过程的源码解析。本文是第二篇：DispatcherServlet处理请求的过程的源码解析。@pdaiSpring进阶-SpringMVC实现原理之DispatcherServlet处理请求的
2019-06-05 第十七把巴鲁克
今天去实验田里实习，见到了福寿螺真的可怕且牛皮，六级也快来了，说实话还是害怕。我昨天考了环工原理，真的太难了，太烦了，理工科真的难，烦。实验报告还是没写，要抓紧速度抓紧时间，还是应该学会努力学习，远离一些不上进的事物。
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
企业级区块链平台Hyperchain核心原理剖析 boyedu 区块链区块链企业级区块链平台 Hyperchain
Hyperchain作为国产自主可控的企业级联盟区块链平台，其核心原理围绕高性能共识、隐私保护、智能合约引擎及可扩展架构展开，通过多模块协同实现企业级区块链网络的高效部署与安全运行。以下从核心架构、关键技术、性能优化、安全机制、应用场景五个维度展开剖析：一、核心架构：分层解耦与模块化设计Hyperchain采用分层架构，将区块链功能解耦为独立模块，支持灵活组合与扩展：P2P网络层由验证节点（VP）
通义万相2.2：开启高清视频生成新纪元 Liudef06小白特殊专栏 AIGC 人工智能人工智能通义万相2.2 图生视频
通义万相2.2：开启高清视频生成新纪元2025年7月28日，中国AI领域迎来里程碑时刻——通义万相团队正式开源其革命性视频生成模型Wan2.2的核心权重，这标志着开源社区首次获得支持720P高清视频生成的先进模型架构。一、架构革新：混合专家系统1.1MoE视频扩散架构通义万相2.2首次将混合专家（MoE）架构引入视频扩散模型，通过双专家系统实现计算效率与模型容量的平衡：classMoEVideoD
为什么焦虑、抑郁、自残的青少年越来越多？精神健康
很多家长觉得没缺孩子吃的穿的，他们有安稳的生活，他们有什么可焦虑、抑郁的，但现在的孩子，学习压力越来越大，每天休息的时间越来越少，出现焦虑抑郁是很正常的。从发展的角度看，青少年时期，人的身体、情绪，智力、人格都急剧发展，正从未成熟走向成熟，情绪起伏不定，易冲动，再者，由于缺乏生活经验，以及来自于家长、学校、社会的各种要求和压力，从而不知所措，心中的焦虑、恐惧、彷徨得不到及时的排解，从而导致心理上的
读书打卡《别想太多啦》 chenchen_68ed
第一，世间之事，不去尝试永远不知道其中的奥秘，在尝试中有失败是必然的。如果担心失败，那什么都学不会。第二，经历的失败越多，越会对失败者抱有宽容的态度，“原来如此，我也经历过类似的失败啦，那只是暂时的”。经历越多失败的长者，越能包容别人，这也就是所谓的“越年长越宽容”。成熟的人，就是在众多失败经历中不断学习，并接纳别人的失败。对于他人的小小过失不吹毛求疵，自己的心态会更加平和。在不断失败中学习，让自
2025年SDK游戏盾终极解析：重新定义手游安全的“隐形护甲” 上海云盾商务经理杨杨游戏安全
副标题：从客户端加密到AI反外挂，拆解全链路防护如何重塑游戏攻防天平引言：当传统高防在手游战场“失效”2025年全球手游市场规模突破$2000亿，黑客单次攻击成本却降至$30——某SLG游戏因协议层CC攻击单日流失37%玩家，某开放世界游戏遭低频DDoS瘫痪6小时损失千万。传统高防IP的致命短板暴露无遗：无法识别伪造客户端流量、难防协议篡改、误杀率超15%。而集成于游戏终端的SDK游戏盾，正以“源
LVS+Keepalived实现高可用和负载均衡 2401_84412895 程序员 lvs 负载均衡运维
2、开启网卡子接口配置VIP[root@a~]#cd/etc/sysconfig/network-scripts/[root@anetwork-scripts]#cp-aifcfg-ens32ifcfg-ens32:0[root@anetwork-scripts]#catifcfg-ens32:0BOOTPROTO=staticDEVICE=ens32:0ONBOOT=yesIPADDR=10.1
2023-01-26 胡喜平
我觉得《可见的学习》一书确实从底层逻辑说清楚了，教学的本质。可是太多术语和概念，一时间难以消化啊。而且知道和懂得有距离，运用就更不行了，需要高手和专家的指导。我需要多听听新课标的讲座了，来反复印证。读论文也有了一点点灵感，明天修改我的论文。
平静得接受自己的笨拙 20190118 晨间日记吴伯符
图片发自App最近做了一个关于微习惯的分享，这里有八个字：微量开始，超额完成。这里的言下之意其实是要你在一开始的时候，平静地接受自己的笨拙。接受自己的笨拙，理解自己的笨拙，放慢速度尝试，观察哪里可以改进，再反复练习，观察自己哪里可以再进一步改进，再反复…这是学习一切技能的必须的过程。这里的两个关键点是：1.尽快的开始这个过程，这就能够用到微习惯的微量开始。2.尽快的度过这个过程，这就需要用到超额完
CodeFoeces-450B ss5smi
题目原题链接：B.JzzhuandSequences题意根据公式公式计算对应fn的值。参考了其他作者的代码和思路。找循环点。负数取余需要加取余数到>0为止才可取余。代码#includeusingnamespacestd;constintmod=1e9+7;intmain(){longlongf[10],x,y,n;cin>>x>>y>>n;x=(x+mod)%mod;y=(y+mod)%mod;f
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
二十四节气组诗谷雨离陌_6639
图片来源网络，若侵犯了你的权益，请联系我删除6.谷雨文/离陌背上行囊背上如行囊的我从此任行程马不停蹄今天家乡的田野春雨快马加鞭播下希望的种子观音不语目送着我和夏天一道在观音山出关图片来源网络，若侵犯了你的权益，请联系我删除你好啊，我是离陌，已然在懵懂中走过了16年的岁月，为了珍惜当下的每一秒，所以立志做一名终身学习者。文学对于我来说是一种信仰，诗歌是我的生命。人生之道，四通八达，即入文学，自当持之
你好，2020年瑄瑄妍妍的妈咪
早上好，今天是2020年的第一天，也就是元旦，新年新的一天开始了。新的开始，重新规划未来的一年。从今天开始，用了一个新的记账软件，之前的随手记软件，也没有删除，只是重新下载了一个别的软件，开始一个新的记账旅程，对于理财开支，有个新的规划。通过小红书视频软件，学习了不少育儿知识，和各种不同的美食，以后动手制作，给宝宝做健康美味的营养餐。学习方面，继续学英语吧！虽然是抽出时间学的，进度也比较慢，但是积
【异常】使用 LiteFlow 框架时，提示错误ChainDuplicateException: [chain name duplicate] chainName=categoryChallenge 本本本添哥 002 -进阶开发能力 java
一、报错内容Causedby:com.yomahub.liteflow.exception.ChainDuplicateException:[chainnameduplicate]chainName=categoryChallengeatcom.yomahub.liteflow.parser.helper.ParserHelper.lambda$null$0(ParserHelper.java:1
常规笔记本和加固笔记本的区别 luchengtech 电脑三防笔记本加固计算机加固笔记本
在现代科技产品中，笔记本电脑因其便携性和功能性被广泛应用。根据使用场景和需求的不同，笔记本可分为常规笔记本和加固笔记本，二者在多个方面存在显著区别。适用场景是区分二者的重要标志。常规笔记本主要面向普通消费者和办公人群，适用于家庭娱乐、日常办公、学生学习等相对稳定的室内环境。比如，人们在家用它追剧、处理文档，学生在教室用它完成作业。而加固笔记本则专为特殊行业设计，像军事、野外勘探、工业制造、交通运输
《云襄传》：云襄做的局是浑水摸鱼吗？书生号贺
云襄入南都是要浑水摸鱼吗？他是云台的高材生吗？他为啥笃定师父一定会让他留在南都？他为啥觉得他能够做局成功？他是在经商吗？还是在经营人心与欲望？云襄是云台弟子，云台属千门的一支，另一支叫凌渊，云台教人经商之道，重智慧，凌渊以武力取胜，但倍受打压。云襄学习十五年，下高山奔越州，途经南洋，因恩人闻聪被害，囚于白驹镇，念于情分，被卷入这样一个局面里，结识了舒亚南与金十两，于是，复仇小组成立，目标是南都漕帮
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
心力践行营十二期一阶学习打卡 LX_王彤彤
姓名：王彤彤时间：2021年4月24日一：朗读师父的十大人生哲学二：师父的早安分享感悟很喜欢这句话：所有的行动都是基于目标的尝试，没有所谓的失败，只是不同尝试后得到的不同结果，让我们更好地调整下一次的行动。三：感恩日记1.我太幸福了，我很感恩姑姑，因为姑姑放假又投喂了我，还给我带了饺子回家，这让我感觉很幸福。谢谢，谢谢，谢谢。2.我太幸福了，我很感恩师父晚上的直播，因为听他的分享我知道怎么更好的去
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring

PyTorch深度学习框架60天进阶学习计划 - 第28天：多模态模型实践（二）