利用Flink在大数据领域实现实时推荐系统

关键词：Flink、实时推荐系统、大数据处理、流式计算、机器学习、用户画像、协同过滤

摘要：本文深入探讨如何利用Apache Flink构建高性能的实时推荐系统。我们将从推荐系统的基本原理出发，详细分析Flink在实时数据处理中的优势，并通过完整的项目案例展示如何实现一个端到端的实时推荐解决方案。文章涵盖核心算法实现、系统架构设计、性能优化策略以及实际应用场景，为读者提供构建企业级实时推荐系统的全面指导。

1. 背景介绍

1.1 目的和范围

本文旨在为大数据工程师和架构师提供使用Apache Flink构建实时推荐系统的完整指南。我们将覆盖从基础概念到高级实现的全部内容，重点解决实时推荐系统中的关键挑战，包括低延迟处理、状态管理和算法集成。

1.2 预期读者

大数据开发工程师
机器学习工程师
系统架构师
数据科学家
对实时计算和推荐系统感兴趣的技术管理者

1.3 文档结构概述

文章首先介绍推荐系统和Flink的基础知识，然后深入探讨实时推荐系统的架构设计。随后我们将通过实际代码示例展示核心算法实现，最后讨论优化策略和未来发展方向。

1.4 术语表

1.4.1 核心术语定义

Flink: Apache开源的分布式流处理框架
实时推荐系统: 能够在毫秒级响应时间内生成个性化推荐的系统
用户画像: 对用户特征和行为的抽象表示
协同过滤: 基于用户历史行为的推荐算法

1.4.2 相关概念解释

事件时间(Event Time): 事件实际发生的时间
处理时间(Processing Time): 系统处理事件的时间
窗口(Window): 将无限数据流划分为有限块进行处理的方式

1.4.3 缩略词列表

CEP: Complex Event Processing (复杂事件处理)
ALS: Alternating Least Squares (交替最小二乘法)
CF: Collaborative Filtering (协同过滤)
UDF: User Defined Function (用户自定义函数)

2. 核心概念与联系

实时推荐系统的核心架构如下图所示：

用户行为数据源

Flink实时处理

商品/内容数据源

特征工程

推荐模型

推荐结果存储

API服务

客户端展示

Flink在实时推荐系统中的关键作用体现在三个方面：

实时数据管道: 处理用户行为流(点击、浏览、购买等)
近线学习: 持续更新推荐模型参数
实时特征计算: 动态计算用户兴趣特征

推荐系统与Flink的集成模式主要有两种：

批流一体: 使用Flink的DataSet API处理历史数据，DataStream API处理实时数据
Lambda架构: 实时路径处理最新数据，批处理路径定期修正结果

3. 核心算法原理 & 具体操作步骤

3.1 实时协同过滤算法实现

协同过滤是推荐系统最常用的算法之一，下面是基于Flink的实时实现：

from pyflink.datastream import StreamExecutionEnvironment
from pyflink.table import StreamTableEnvironment, DataTypes
from pyflink.table.descriptors import Schema, Kafka, Json

# 初始化Flink环境
env = StreamExecutionEnvironment.get_execution_environment()
t_env = StreamTableEnvironment.create(env)

# 定义Kafka数据源
t_env.connect(Kafka()
             .version("universal")
             .topic("user_behavior")
             .start_from_earliest()
             .property("zookeeper.connect", "localhost:2181")
             .property("bootstrap.servers", "localhost:9092")) \
    .with_format(Json()
                .fail_on_missing_field(True)
                .schema(DataTypes.ROW([
                    DataTypes.FIELD("user_id", DataTypes.BIGINT()),
                    DataTypes.FIELD("item_id", DataTypes.BIGINT()),
                    DataTypes.FIELD("rating", DataTypes.FLOAT()),
                    DataTypes.FIELD("timestamp", DataTypes.BIGINT())
                ]))) \
    .with_schema(Schema()
                .field("user_id", DataTypes.BIGINT())
                .field("item_id", DataTypes.BIGINT())
                .field("rating", DataTypes.FLOAT())
                .field("timestamp", DataTypes.BIGINT())) \
    .create_temporary_table("user_behavior")

# 计算用户-物品共现矩阵
t_env.sql_query("""
    SELECT
        a.user_id,
        b.item_id as recommended_item,
        SUM(a.rating * b.rating) as similarity,
        COUNT(*) as cooccurrence_count
    FROM user_behavior a
    JOIN user_behavior b ON a.item_id = b.item_id AND a.user_id != b.user_id
    GROUP BY a.user_id, b.item_id
    HAVING cooccurrence_count > 5
""").to_retract_stream().print()

env.execute("Real-time Collaborative Filtering")

3.2 基于时间衰减的用户兴趣模型

from pyflink.common import WatermarkStrategy
from pyflink.common.time import Time
from pyflink.datastream.window import TumblingEventTimeWindows

# 定义水印策略
watermark_strategy = WatermarkStrategy.for_bounded_out_of_orderness(Time.seconds(5)) \
    .with_timestamp_assigner(lambda event, record_timestamp: event['timestamp'])

# 创建数据流
behavior_stream = env.from_source(
    source=KafkaSource.builder()
        .set_bootstrap_servers("localhost:9092")
        .set_topics("user_behavior")
        .set_group_id("flink-group")
        .set_starting_offsets(KafkaOffsetsInitializer.earliest())
        .set_value_only_deserializer(SimpleStringSchema())
        .build(),
    watermark_strategy=watermark_strategy,
    source_name="kafka_source"
)

# 时间衰减窗口处理
class TimeDecayWindowFunction(WindowFunction):
    def apply(self, key, window, inputs, collector):
        user_id = key[0]
        item_scores = {}
        current_time = window.max_timestamp()

        for event in inputs:
            item_id = event['item_id']
            event_time = event['timestamp']
            time_diff = current_time - event_time
            decay_factor = 2 ** (-time_diff / (24*3600*1000))  # 按天衰减

            if item_id in item_scores:
                item_scores[item_id] += event['rating'] * decay_factor
            else:
                item_scores[item_id] = event['rating'] * decay_factor

        # 输出用户当前兴趣分布
        collector.collect({
            "user_id": user_id,
            "timestamp": current_time,
            "interest_distribution": item_scores
        })

# 应用窗口函数
behavior_stream \
    .key_by(lambda x: x['user_id']) \
    .window(TumblingEventTimeWindows.of(Time.hours(1))) \
    .apply(TimeDecayWindowFunction()) \
    .add_sink(KafkaSink.builder()
        .set_bootstrap_servers("localhost:9092")
        .set_record_serializer(KafkaRecordSerializationSchema.builder()
            .set_topic("user_interests")
            .set_value_serialization_schema(SimpleStringSchema())
            .build())
        .build())

env.execute("Time Decay User Interest Model")

4. 数学模型和公式 & 详细讲解

4.1 协同过滤的矩阵分解模型

协同过滤的核心是将用户-物品评分矩阵R分解为两个低维矩阵：

$\approx P \times Q^T$

其中：

$\in \mathbb{R}^{m \times n}$ 是用户-物品评分矩阵
$\in \mathbb{R}^{m \times k}$ 是用户潜在特征矩阵
$\in \mathbb{R}^{n \times k}$ 是物品潜在特征矩阵
$k$ 是潜在空间的维度

优化目标是最小化以下损失函数：

$\min_{P,Q} \sum_{(u,i) \in \mathcal{K}} (r_{ui} - p_u^T q_i)^2 + \lambda (\|p_u\|^2 + \|q_i\|^2)$

其中 $\mathcal{K}$ 是已知评分的集合， $\lambda$ 是正则化参数。

4.2 实时更新的增量学习

对于流式数据，我们采用小批量梯度下降进行参数更新：

对于每个小批量数据 $\mathcal{B}$ ，更新规则为：

$p_u \leftarrow p_u + \gamma \left( \sum_{i \in \mathcal{B}_u} e_{ui} q_i - \lambda p_u \right)$

$q_i \leftarrow q_i + \gamma \left( \sum_{u \in \mathcal{B}_i} e_{ui} p_u - \lambda q_i \right)$

其中：

$e_{ui} = r_{ui} - p_u^T q_i$ 是预测误差
$\gamma$ 是学习率
$\mathcal{B}_u$ 和 $\mathcal{B}_i$ 分别是小批量中与用户u和物品i相关的数据

4.3 时间衰减因子

为了反映用户兴趣的变化，我们引入时间衰减因子：

$2^{-(t_{current} - t_{event})/\tau}$

其中 $\tau$ 是半衰期参数，控制衰减速度。调整后的评分计算为：

$\hat{r}_{ui} = \sum_{e \in E_{ui}} w(t_e) r_{ui}^e$

$E_{ui}$ 是用户u对物品i的所有历史事件集合。

5. 项目实战：代码实际案例和详细解释说明

5.1 开发环境搭建

5.1.1 环境要求

Java 8/11
Apache Flink 1.15+
Python 3.7+ (PyFlink)
Kafka 2.8+
Redis 6.x (用于特征缓存)

5.1.2 依赖配置


<dependencies>
    <dependency>
        <groupId>org.apache.flinkgroupId>
        <artifactId>flink-streaming-java_2.12artifactId>
        <version>1.15.2version>
    dependency>
    <dependency>
        <groupId>org.apache.flinkgroupId>
        <artifactId>flink-state-processor-api_2.12artifactId>
        <version>1.15.2version>
    dependency>
    <dependency>
        <groupId>org.apache.flinkgroupId>
        <artifactId>flink-connector-kafka_2.12artifactId>
        <version>1.15.2version>
    dependency>
dependencies>

5.2 源代码详细实现和代码解读

5.2.1 实时特征工程模块

public class UserBehaviorFeatureGenerator extends RichFlatMapFunction<UserBehavior, UserFeatures> {

    private transient ValueState<Map<Long, Double>> itemInterestsState;
    private transient ValueState<Long> lastUpdatedState;

    @Override
    public void open(Configuration parameters) {
        ValueStateDescriptor<Map<Long, Double>> itemDescriptor = new ValueStateDescriptor<>(
            "itemInterests",
            TypeInformation.of(new TypeHint<Map<Long, Double>>() {})
        );
        itemInterestsState = getRuntimeContext().getState(itemDescriptor);

        ValueStateDescriptor<Long> timeDescriptor = new ValueStateDescriptor<>(
            "lastUpdated",
            TypeInformation.of(new TypeHint<Long>() {})
        );
        lastUpdatedState = getRuntimeContext().getState(timeDescriptor);
    }

    @Override
    public void flatMap(UserBehavior behavior, Collector<UserFeatures> out) throws Exception {
        Map<Long, Double> currentInterests = itemInterestsState.value();
        if (currentInterests == null) {
            currentInterests = new HashMap<>();
        }

        Long lastUpdated = lastUpdatedState.value();
        long currentTime = System.currentTimeMillis();

        // 应用时间衰减
        if (lastUpdated != null) {
            double decayFactor = Math.pow(0.5, (currentTime - lastUpdated) / (24 * 3600 * 1000.0));
            currentInterests.replaceAll((k, v) -> v * decayFactor);
        }

        // 更新当前行为
        double newScore = currentInterests.getOrDefault(behavior.getItemId(), 0.0) + behavior.getRating();
        currentInterests.put(behavior.getItemId(), newScore);

        // 更新状态
        itemInterestsState.update(currentInterests);
        lastUpdatedState.update(currentTime);

        // 输出特征
        out.collect(new UserFeatures(
            behavior.getUserId(),
            currentTime,
            new HashMap<>(currentInterests)
        ));
    }
}

5.2.2 实时推荐服务

# PyFlink实现实时推荐服务
from pyflink.datastream import StreamExecutionEnvironment
from pyflink.datastream.connectors import KafkaSource, KafkaSink
from pyflink.datastream.formats import JsonRowDeserializationSchema, JsonRowSerializationSchema
from pyflink.common import WatermarkStrategy, Row
from pyflink.common.time import Time
from pyflink.datastream.window import TumblingEventTimeWindows
from pyflink.datastream.functions import ProcessWindowFunction, RuntimeContext
from pyflink.datastream.state import ValueStateDescriptor, MapStateDescriptor

class RealTimeRecommender(ProcessWindowFunction):
    def __init__(self):
        self.model_state = None
        self.item_features = None

    def open(self, runtime_context: RuntimeContext):
        # 加载预训练模型
        model_desc = ValueStateDescriptor("recommendation_model", Types.PICKLED_BYTE_ARRAY())
        self.model_state = runtime_context.get_state(model_desc)

        # 加载物品特征
        item_desc = MapStateDescriptor("item_features", Types.LONG(), Types.PICKLED_BYTE_ARRAY())
        self.item_features = runtime_context.get_map_state(item_desc)

    def process(self, key, context, elements, out):
        # 获取当前用户特征
        user_features = elements[0]['features']

        # 获取推荐模型
        model = self.model_state.value()
        if model is None:
            model = load_default_model()

        # 生成推荐
        recommendations = []
        for item_id in self.item_features.keys():
            item_feature = self.item_features.get(item_id)
            score = model.predict(user_features, item_feature)
            recommendations.append((item_id, score))

        # 取TopN推荐
        recommendations.sort(key=lambda x: x[1], reverse=True)
        top_recommendations = recommendations[:10]

        # 输出推荐结果
        out.collect({
            "user_id": key[0],
            "timestamp": context.window().end,
            "recommendations": top_recommendations
        })

# 主程序
def main():
    env = StreamExecutionEnvironment.get_execution_environment()

    # 定义Kafka源
    source = KafkaSource.builder() \
        .set_bootstrap_servers("kafka:9092") \
        .set_topics("user_features") \
        .set_group_id("recommender_group") \
        .set_starting_offsets(KafkaOffsetsInitializer.earliest()) \
        .set_value_only_deserializer(
            JsonRowDeserializationSchema.builder()
                .type_info(Types.ROW([
                    Types.LONG(),  # user_id
                    Types.MAP(Types.LONG(), Types.DOUBLE())  # features
                ])).build()
        ).build()

    # 定义处理流程
    features_stream = env.from_source(
        source,
        WatermarkStrategy.for_bounded_out_of_orderness(Time.seconds(5)),
        "Kafka Source"
    )

    # 应用推荐逻辑
    recommendations = features_stream \
        .key_by(lambda x: x[0]) \
        .window(TumblingEventTimeWindows.of(Time.minutes(1))) \
        .process(RealTimeRecommender())

    # 定义Kafka Sink
    sink = KafkaSink.builder() \
        .set_bootstrap_servers("kafka:9092") \
        .set_record_serializer(
            KafkaRecordSerializationSchema.builder()
                .set_topic("recommendations")
                .set_value_serialization_schema(
                    JsonRowSerializationSchema.builder()
                        .with_type_info(Types.ROW([
                            Types.LONG(),  # user_id
                            Types.LIST(Types.TUPLE([Types.LONG(), Types.DOUBLE()]))  # recommendations
                        ])).build()
                ).build()
        ).build()

    # 输出结果
    recommendations.sink_to(sink)

    # 执行作业
    env.execute("Real-time Recommendation Job")

if __name__ == '__main__':
    main()

5.3 代码解读与分析

上述代码实现了一个完整的实时推荐系统核心组件：

特征生成模块:
- 使用Flink的状态管理功能维护用户兴趣特征
- 实现时间衰减机制，使旧行为的影响逐渐减弱
- 保证特征更新的实时性和一致性
推荐服务模块:
- 集成预训练的推荐模型
- 利用窗口函数定期生成推荐结果
- 支持模型的热更新和状态管理
系统集成:
- 使用Kafka作为消息中间件
- 实现端到端的Exactly-Once处理语义
- 支持水平扩展和高可用性

关键设计考虑：

状态管理: 使用Flink的ValueState和MapState保存用户特征和模型参数
时间处理: 正确处理事件时间和处理时间，使用水印处理延迟数据
性能优化: 批处理窗口内的计算，减少状态访问开销

6. 实际应用场景

6.1 电商实时个性化推荐

首页商品推荐: 基于用户实时浏览行为调整推荐结果
购物车关联推荐: 根据当前购物车内容推荐相关商品
实时价格敏感度推荐: 检测用户对促销活动的响应调整推荐策略

6.2 内容平台推荐

新闻热点推荐: 结合实时点击率和用户兴趣推送新闻
视频流推荐: 根据观看时长和互动行为调整视频推荐
社交内容推荐: 基于用户实时社交互动推荐相关内容

6.3 游戏道具推荐

实时行为分析: 根据玩家当前游戏行为推荐道具
赛季装备推荐: 结合赛季特性和玩家表现推荐装备
社交推荐: 推荐与好友使用相似的道具和皮肤

7. 工具和资源推荐

7.1 学习资源推荐

7.1.1 书籍推荐

《Flink原理与实践》- 详细讲解Flink核心原理
《推荐系统实践》- 推荐系统经典教材
《Streaming Systems》- 流式系统理论权威指南

7.1.2 在线课程

Coursera: “Big Data Analysis with Scala and Spark”
Udemy: “Apache Flink for Real-time Data Processing”
edX: “Building Real-time Recommendation Systems”

7.1.3 技术博客和网站

Flink官方文档: https://flink.apache.org/
Netflix Tech Blog: 实时推荐系统实战案例
LinkedIn Engineering Blog: 大规模推荐系统架构

7.2 开发工具框架推荐

7.2.1 IDE和编辑器

IntelliJ IDEA with Flink插件
VS Code with Python扩展
Jupyter Notebook for原型开发

7.2.2 调试和性能分析工具

Flink Web UI: 作业监控和调优
Prometheus + Grafana: 指标监控
JProfiler: 性能分析工具

7.2.3 相关框架和库

Apache Kafka: 消息队列
Redis: 特征缓存
TensorFlow/PyTorch: 深度学习模型

7.3 相关论文著作推荐

7.3.1 经典论文

“Amazon.com Recommendations: Item-to-Item Collaborative Filtering”
“Collaborative Filtering for Implicit Feedback Datasets”
“The Lambda Architecture: Principles for Architecting Real-time Big Data Systems”

7.3.2 最新研究成果

“Real-time Personalization using Embeddings for Search Ranking at Airbnb”
“Deep Neural Networks for YouTube Recommendations”
“BERT4Rec: Sequential Recommendation with Bidirectional Encoder Representations”

7.3.3 应用案例分析

Netflix实时推荐架构演进
淘宝双十一实时推荐系统
Spotify音乐推荐系统

8. 总结：未来发展趋势与挑战

8.1 发展趋势

深度学习和流式处理的融合:
- 将Transformer等先进模型应用于实时推荐
- 流式模型训练和推理的统一架构
多模态推荐系统:
- 结合文本、图像和视频内容分析
- 实时多模态特征提取和融合
边缘计算集成:
- 在靠近用户端进行部分推荐计算
- 减少云端通信延迟

8.2 技术挑战

低延迟和高精度的平衡:
- 如何在毫秒级延迟内提供高质量推荐
- 增量学习和全量再训练的协调
状态管理和容错:
- 大规模特征状态的高效存储和恢复
- 分布式一致性保证
冷启动问题:
- 新用户和新物品的实时处理策略
- 零样本学习和元学习技术的应用
可解释性和公平性:
- 实时推荐决策的解释
- 避免算法偏见和歧视

9. 附录：常见问题与解答

Q1: Flink和Spark Streaming在实时推荐系统中的主要区别是什么？

A1: Flink采用真正的流处理模型，而Spark Streaming采用微批处理。Flink在低延迟(毫秒级)场景表现更好，状态管理更完善，适合需要严格实时性的推荐系统。

Q2: 如何处理推荐系统中的数据稀疏问题？

A2: 可以采用以下策略：

混合推荐方法(结合内容过滤和协同过滤)
使用深度学习模型学习稠密特征表示
利用辅助信息(如社交网络、物品属性)
应用迁移学习技术

Q3: 实时推荐系统如何保证推荐结果的一致性？

A3: 关键措施包括：

使用Flink的Exactly-Once处理语义
实现幂等性写入推荐结果存储
采用版本控制机制跟踪特征和模型更新
设置合理的状态保存点(Savepoint)

Q4: 如何评估实时推荐系统的效果？

A4: 除了传统指标(准确率、召回率)，还需考虑：

实时响应时间
推荐结果的新颖性和多样性
业务指标转化率(点击率、购买率等)
A/B测试框架集成

Q5: 如何处理推荐系统中的概念漂移问题？

A5: 解决方案包括：

动态调整时间衰减因子
实现模型参数的在线学习
监测性能指标自动触发模型重训练
集成概念漂移检测算法

10. 扩展阅读 & 参考资料

Apache Flink官方文档: https://flink.apache.org/
“Real-time Recommendation Systems with Flink” - Flink Forward Conference
“Building Large-scale Real-time Recommendation Systems” - ACM SIGMOD
“Deep Learning for Real-time Recommendation” - NeurIPS Workshop
“Scalable and Reliable Real-time Recommendation at Pinterest” - Pinterest Engineering Blog
“The Evolution of Recommendation Systems at Alibaba” - Alibaba Tech
“Real-time Machine Learning: Challenges and Solutions” - IEEE Internet Computing

python 读excel每行替换_Python脚本操作Excel实现批量替换功能 weixin_39646695 python 读excel每行替换
Python脚本操作Excel实现批量替换功能大家好，给大家分享下如何使用Python脚本操作Excel实现批量替换。使用的工具Openpyxl，一个处理excel的python库，处理excel，其实针对的就是WorkBook，Sheet，Cell这三个最根本的元素~明确需求原始excel如下我们的目标是把下面excel工作表的sheet1表页A列的内容“替换我吧”批量替换为B列的“我用来替换的
三菱PLC全套学习资料及应用手册 good2know
本文还有配套的精品资源，点击获取简介：三菱PLC作为工业自动化领域的核心设备，其系列产品的学习和应用需要全面深入的知识。本次资料包为学习者提供从基础到进阶的全方位学习资源，包括各种型号PLC的操作手册、编程指南、软件操作教程以及实际案例分析，旨在帮助用户系统掌握PLC的编程语言、指令系统及在各类工业应用中的实施。1.三菱PLC基础知识入门1.1PLC的基本概念可编程逻辑控制器（PLC）是工业自动化
2022-10-20 体力劳动者
不因感觉稍纵即逝就不加记录。在女儿睡觉后我记下今天的小故事。接手新班级后，今天是第二次收到家长的感谢信（微信）。是我表扬次数最多的两位学生家长致来的感谢，他们明显感受到孩子自信、阳光了不少，写作业由被动变为了主动，家庭氛围也由鸡飞狗跳变成了其乐融融。在被顽皮的学生气得头晕之后，我感到了久违的价值感，责任感甚至使命感，我回复家长这样一句话：我们也需要家长的反馈好让我们的教育工作更有劲头。我也认识到，
《玉骨遥》：大司命为什么不杀朱颜？原因没那么简单 windy天意晚晴
《玉骨遥》里，朱颜就是时影的命劫之人。重明与时影早就知道，他们一直瞒着大司命，如今大司命也知道了真相。可是大司命却没有杀朱颜，而是给朱颜下了诛心咒，还说时影的命劫已经破了，真的如此吗？1、计划总是赶不上变化的大司命从目前剧情来说，大司命还不如时影，他信心十足的事情总会有纰漏。他不让时影见命劫之女，结果时影还是遇上了。他想让时影走火入魔，一心复仇，结果时影在朱颜的劝说下放下了仇恨。大司命让时影开山收
移动端城市区县二级联动选择功能实现包 good2know
本文还有配套的精品资源，点击获取简介：本项目是一套为移动端设计的jQuery实现方案，用于简化用户在选择城市和区县时的流程。它包括所有必需文件：HTML、JavaScript、CSS及图片资源。通过动态更新下拉菜单选项，实现城市到区县的联动效果，支持数据异步加载。开发者可以轻松集成此功能到移动网站或应用，并可基于需求进行扩展和优化。1.jQuery移动端解决方案概述jQuery技术简介jQuery
日更006 终极训练营day3 懒cici
人生创业课（2）今天的主题：学习方法一：遇到有用的书，反复读，然后结合自身实际，列践行清单，不要再写读书笔记思考这本书与我有什么关系，我在哪些地方能用到，之后我该怎么用方法二：读完书没映像怎么办?训练你的大脑，方法：每读完一遍书，立马合上书，做一场分享，几分钟都行对自己的学习要求太低，要逼自己方法三：学习深度不够怎么办？找到细分领域的榜样，把他们的文章、书籍、产品都体验一遍，成为他们的超级用户，向
9、汇编语言编程入门：从环境搭建到简单程序实现神经网络酱汇编语言 MEPIS GNU工具链
汇编语言编程入门：从环境搭建到简单程序实现1.数据存储介质问题解决在处理数据存储时，若要使用MEPIS系统，需确保有其可访问的存储介质。目前，MEPIS无法向采用NTFS格式（常用于Windows2000和XP工作站）的硬盘写入数据。不过，若硬盘采用FAT32格式，MEPIS就能进行写入操作。此外，MEPIS还能将文件写入软盘和大多数USB闪存驱动器。若工作站连接到局域网，还可通过FTP协议或挂载
day15｜前端框架学习和算法 universe_01 前端算法笔记
T22括号生成先把所有情况都画出来，然后（在满足什么情况下）把不符合条件的删除。T78子集要画树状图，把思路清晰。可以用暴力法、回溯法和DFS做这个题DFS深度搜索：每个边都走完，再回溯应用：二叉树搜索，图搜索回溯算法=DFS+剪枝T200岛屿数量（非常经典BFS宽度把树状转化成队列形式，lambda匿名函数“一次性的小函数，没有名字”setup语法糖：让代码更简洁好写的语法ref创建：基本类型的
IK分词初心myp
实现简单的分词功能，智能化分词添加依赖配置：4.10.4org.apache.lucenelucene-core${lucene.version}org.apache.lucenelucene-analyzers-common${lucene.version}org.apache.lucenelucene-queryparser${lucene.version}org.apache.lucenel
《极简思维》第三部分小洋苏兮
整理你的人际关系如何改善人际关系？摘录：因为人际关系问题是人们生活中不快乐的主要原因。感想：感觉这个说的挺对，之前我总是埋头学习，不管舍友不管自己的合作伙伴的一些事情，但实际上，这学期关注了之后好多了摘录：“亲密关系与社交会让你健康而快乐。这是基础。太过于关注成就或不太关心人际关系的人都不怎么快乐。基本上来说，人类就是建立在人脉关系上的。”感想：但是如果有时想的太多就不太好，要以一个开放的心态跟别
我不懂什么是爱，但我给你全部我拥有的香尧
因为怕黑，所以愿意陪伴在夜中行走的人，给他一点点的安全感。因为渴望温柔与爱，所以愿意为别的孩子付出爱与温柔。因为曾遭受侮辱和伤害，所以不以同样的方式施于其他人。如果你向别人出之以利刃，对方还了你爱与包容，真的不要感激他，真的不要赞美他。每一个被人伤害过的人心里都留下了一颗仇恨的种子，他也会想要有一天以眼还眼，以牙还牙。但他未让那颗种子生根发芽，他用一把心剑又一次刺向他自己，用他血荐仇恨，开出一朵温
C++ 计数排序、归并排序、快速排序每天搬一点点砖 c++数据结构算法
计数排序：是一种基于哈希的排序算法。他的基本思想是通过统计每个元素的出现次数，然后根据统计结果将元素依次放入排序后的序列中。这种排序算法适用于范围较小的情况，例如整数范围在0到k之间计数排序步骤：1初始化一个长度为最大元素值加1的计数数组，所有元素初始化为02遍历原始数组，将每个元素值作为索引，在计数数组中对应位置加13将数组清空4遍历计数器数组，按照数组中的元素个数放回到元数组中计数排序的优点和
2023-11-02 一帆f
发现浸润心田的感觉：今天一个机缘之下突然想分享我的婆媳关系，我一边分享一边回忆我之前和儿媳妇关系的微妙变化，特别是分享到我能感受到儿媳妇的各种美好，现在也能心平气和的和老公平等对话，看到自己看到老公，以己推人以人推己自然而然的换位思考，心中有一种美好的能量在涌动，一种浸润心田的感觉从心胸向全身扩散，美好极了……我很想记住这种感觉，赶紧把它写下来以留纪念，也就是当我看见他人的美好，美好的美妙的浸润心
贫穷家庭的孩子考上985以后会怎样？ Mellisa蜜思言
我出生在一个贫穷的农村家庭，据我妈说，我出生的时候才4斤多，而她生完我以后月子里就瘦到70斤。家里一直很穷，父母都是在菜市场卖菜的，家里还有几亩地种庄稼的。我很小开始就要去帮忙，暑假的生活就是帮忙去卖菜和割稻谷，那时候自己对于割稻谷这种事情有着莫名的恐惧，生怕自己长大以后还是每年都要过着割稻谷这种日子。父母因为忙于生计无暇顾及我的学习，幸好我因为看到他们这样子的生活，内心里有深深的恐惧感，驱使着我
实时数据流计算引擎Flink和Spark剖析程小舰 flink spark 数据库 kafka hadoop
在过去几年，业界的主流流计算引擎大多采用SparkStreaming，随着近两年Flink的快速发展，Flink的使用也越来越广泛。与此同时，Spark针对SparkStreaming的不足，也继而推出了新的流计算组件。本文旨在深入分析不同的流计算引擎的内在机制和功能特点，为流处理场景的选型提供参考。（DLab数据实验室w.x.公众号出品）一.SparkStreamingSparkStreamin
日更50天有什么收益？星湾二宝
坚持在平台上日更50天了，平台也为我生成了日更50天徽章，小开心一下这份坚持。日更50天徽章那坚持50天都有哪些收益呢？收益一，就是最直观的那些钻和贝，我这边确实不太高，但是这些贝足够支撑我保持会员的资格，能够在发文的时候帮助友友们去除广告，方便阅读。钻和贝收益二，文章的收获，日更50天，坚持写作3.7万文字，书写的文字也从开始的流水账/碎碎念逐渐加入自己的思考和观点。以前，一个念头会一晃而过，如
Git 与 GitHub 的对比与使用指南一念& 其它 git github
Git与GitHub的对比与使用指南在软件开发中，Git和GitHub是两个密切相关但本质不同的工具。下面我将逐步解释它们的定义、区别、核心概念以及如何协同使用，确保内容真实可靠，基于广泛的技术实践。1.什么是Git？Git是一个分布式版本控制系统，由LinusTorvalds于2005年创建。它的核心功能是跟踪代码文件的变化，帮助开发者管理项目历史记录、协作和回滚错误。Git是开源的，可以在本地
英伟达靠什么支撑起了4万亿？AI泡沫还能撑多久？
英伟达市值突破4万亿美元，既是AI算力需求爆发的直接体现，也暗含市场对未来的狂热预期。其支撑逻辑与潜在风险并存，而AI泡沫的可持续性则取决于技术、商业与地缘政治的复杂博弈。⚙️一、英伟达4万亿市值的核心支撑因素技术垄断与生态壁垒硬件优势：英伟达GPU在AI训练市场占有率超87%，H100芯片的FP16算力达1979TFLOPS，领先竞品3-5倍。CUDA生态：400万开发者构建的软件护城河，成为A
深入解析JVM工作原理：从字节码到机器指令的全过程
一、JVM概述Java虚拟机(JVM)是Java平台的核心组件，它实现了Java"一次编写，到处运行"的理念。JVM是一个抽象的计算机器，它有自己的指令集和运行时内存管理机制。JVM的主要职责：加载：读取.class文件并验证其正确性存储：管理内存分配和垃圾回收执行：解释或编译字节码为机器指令安全：提供沙箱环境限制恶意代码二、JVM架构详解JVM由三个主要子系统组成：1.类加载子系统类加载过程分为
Spring进阶 - SpringMVC实现原理之DispatcherServlet处理请求的过程倾听铃的声后端 spring java mvc 开发语言分布式
前文我们有了IOC的源码基础以及SpringMVC的基础，我们便可以进一步深入理解SpringMVC主要实现原理，包含DispatcherServlet的初始化过程和DispatcherServlet处理请求的过程的源码解析。本文是第二篇：DispatcherServlet处理请求的过程的源码解析。@pdaiSpring进阶-SpringMVC实现原理之DispatcherServlet处理请求的
叮嘱!北恒高级班周一丰创投杯量化私募大赛不正规！受骗不能提现出金被骗真相曝光！天权顾问
量化北恒私募实盘大赛周一丰投票项目安全吗?量化北恒私募实盘大赛周一丰积分投票已经亏损被骗了怎么办？警惕!量化北恒私募实盘大赛周一丰十选五项目合法吗——杀猪盘骗局！被骗提不了款!提不了现!出不来金!不要上当!自古有句话讲得好“人善被欺、马善被骑”，现如今也是被骗子利用到了极致，人善就真该被欺骗吗？狡猾的骗子们就利用到了这点，利用同情心、爱心去进行诈骗，宣传公益捐款、爱心慈善打比赛来骗取资金！正常的投
读书能沁润心灵平等乡马回营小学方燕姣
书，是一泓清澈的溪水，是一片充满生机的芳草地。读书能让孩子的心变得宁静、诗意、豁达。在美好年纪，美好的时光里，我们要创造一切可以创造的机会，让孩子去遨游浩瀚的书海，浸润美好的人生。每个早晨，一股花草的清香扑了个满怀，清脆的读书声响彻了整个校园，回荡在空中久久不能停息。自然界的清韵声音有：鸟鸣声、溪流声、松风声、雨打芭蕉声，而惟读书声最为动听。孩子们的读书声，混和着树上的鸟鸣声，还有微风吹动竹叶的声
Linux系统配置（应用程序） 1风天云月 Linux linux 应用程序编译安装 rpm http
目录前言一、应用程序概述1、命令与程序的关系2、程序的组成3、软件包封装类型二、RPM1、RPM概述2、RPM用法三、编译安装1、解包2、配置3、编译4、安装5、启用httpd服务结语前言在Linux中的应用程序被视为将软件包安装到系统中后产生的各种文档，其中包括可执行文件、配置文件、用户手册等内容，这些文档被组织为一个有机的整体，为用户提供特定的功能，因此对于“安装软件包”与“安装应用程序”这两
第28章汇编语言--- 异常处理 hummhumm 汇编算法开发语言程序设计高级语言异常处理汇编语言
在汇编语言中，异常处理是一个重要的概念，它涉及到处理器如何响应和处理程序运行时发生的非正常情况。异常可以是硬件错误（例如除零错误、非法指令）或者软件触发的中断（例如系统调用）。当发生异常时，处理器会暂停当前正在执行的程序，并转移到一个预先定义好的位置来处理这个异常。为了详细阐述第28章关于汇编语言中的异常处理，我们可以考虑一个简化的例子，展示异常处理的基本结构。请注意，实际的代码将取决于具体的处理
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
JVM 内存模型深度解析：原子性、可见性与有序性的实现练习时长两年半的程序员小胡 JVM 深度剖析：从面试考点到生产实践 jvm java 内存模型
在了解了JVM的基础架构和类加载机制后，我们需要进一步探索Java程序在多线程环境下的内存交互规则。JVM内存模型（JavaMemoryModel，JMM）定义了线程和主内存之间的抽象关系，它通过规范共享变量的访问方式，解决了多线程并发时的数据一致性问题。本文将从内存模型的核心目标出发，详解原子性、可见性、有序性的实现机制，以及volatile、synchronized等关键字在其中的作用。一、J
Flowable 实战落地核心：选型决策与坑点破解练习时长两年半的程序员小胡 Flowable 流程引擎实战指南低代码 BPMN 流程引擎 flowable 后端 java
在企业级流程引擎的落地过程中，选型的准确性和坑点的预见性直接决定项目成败。本文聚焦Flowable实战中最关键的“选型决策”与“常见坑点”，结合真实项目经验，提供可落地的解决方案。一、流程引擎选型：从业务本质出发1.1选型的三大核心维度企业在选择流程引擎时，需避免陷入“技术崇拜”，应回归业务本质。评估Flowable是否适用，可从三个维度判断：业务复杂度若流程涉及动态审批链（如按金额自动升级审批）
Flowable 高级扩展：自定义元素与性能优化实战练习时长两年半的程序员小胡 Flowable 流程引擎实战指南流程图 flowable BPMN 流程引擎 java
在前五篇文章中，我们从基础概念、流程设计、API实战、SpringBoot集成，到外部系统协同，逐步构建了Flowable的应用体系。但企业级复杂场景中，原生功能往往难以满足定制化需求——比如需要特殊的审批规则网关、与决策引擎联动实现动态路由，或是在高并发场景下优化流程引擎性能。本文将聚焦Flowable的高级扩展能力，详解如何自定义流程元素、集成规则引擎，并掌握大型系统中的性能调优策略。一、自定
互信息：理论框架、跨学科应用与前沿进展大千AI助手人工智能 Python #OTHER 人工智能深度学习算法互信息香农通信随机变量
1.起源与核心定义互信息（MutualInformation,MI）由克劳德·香农（ClaudeShannon）在1948年开创性论文《AMathematicalTheoryofCommunication》中首次提出，该论文奠定了现代信息论的基础。互信息用于量化两个随机变量之间的统计依赖关系，定义为：若已知一个随机变量的取值，能为另一个随机变量提供的信息量。数学上，对于离散随机变量XXX和YYY，
《实际生活是我们的指南针》——教育中寻找曙光托克托126何芳
陶行知先生的文章相对《致青年教师》比较难理解，但是他热爱学生,在书中处处能感受到。在《实际生活是我们的指南针》文中他说道:“我虽觉得我有好多地方可以帮助诸位,但指志针确是有些不敢当。我和诸位同是在乡村里摸路的人。我们的真正指南针只是实际生活。”这些话不仅使人感到他非常谦虛,既不夸大自己的作用也不轻视自己的作用。图片发自App我们的真正指南针只是实际生活。实际生活向我们供给无穷的问题,要求不断的解决
log4j对象改变日志级别 3213213333332132 java log4j level log4j对象名称日志级别
log4j对象改变日志级别可批量的改变所有级别，或是根据条件改变日志级别。 log4j配置文件： log4j.rootLogger=ERROR,FILE,CONSOLE,EXECPTION #log4j.appender.FILE=org.apache.log4j.RollingFileAppender log4j.appender.FILE=org.apache.l
elk+redis 搭建nginx日志分析平台 ronin47 elasticsearch kibana logstash
elk+redis 搭建nginx日志分析平台 logstash,elasticsearch,kibana 怎么进行nginx的日志分析呢？首先，架构方面，nginx是有日志文件的，它的每个请求的状态等都有日志文件进行记录。其次，需要有个队列，redis的l
Yii2设置时区 dcj3sjt126com PHP timezone yii2
时区这东西，在开发的时候，你说重要吧，也还好，毕竟没它也能正常运行，你说不重要吧，那就纠结了。特别是linux系统，都TMD差上几小时，你能不痛苦吗？win还好一点。有一些常规方法，是大家目前都在采用的1、php.ini中的设置，这个就不谈了，2、程序中公用文件里设置，date_default_timezone_set一下时区3、或者。。。自己写时间处理函数，在遇到时间的时候，用这个函数处理（比较
js实现前台动态添加文本框，后台获取文本框内容 171815164 文本框
<%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://w
持续集成工具 g21121 持续集成
持续集成是什么？我们为什么需要持续集成？持续集成带来的好处是什么？什么样的项目需要持续集成？... 持续集成(Continuous integration ,简称CI)，所谓集成可以理解为将互相依赖的工程或模块合并成一个能单独运行
数据结构哈希表(hash)总结永夜-极光数据结构
1.什么是hash 来源于百度百科: Hash，一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入，通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
乱七八糟程序员是怎么炼成的
eclipse中的jvm字节码查看插件地址： http://andrei.gmxhome.de/eclipse/ 安装该地址的outline 插件后重启，打开window下的view下的bytecode视图 http://andrei.gmxhome.de/eclipse/ jvm博客： http://yunshen0909.iteye.com/blog/2
职场人伤害了“上司” 怎样弥补 aijuans 职场
由于工作中的失误，或者平时不注意自己的言行“伤害”、“得罪”了自己的上司，怎么办呢？　　在职业生涯中这种问题尽量不要发生。下面提供了一些解决问题的建议：　　一、利用一些轻松的场合表示对他的尊重　　即使是开明的上司也很注重自己的权威，都希望得到下属的尊重，所以当你与上司冲突后，最好让不愉快成为过去，你不妨在一些轻松的场合，比如会餐、联谊活动等，向上司问个好，敬下酒，表示你对对方的尊重，
深入浅出url编码 antonyup_2006 应用服务器浏览器 servlet weblogic IE
出处：http://blog.csdn.net/yzhz 杨争 http://blog.csdn.net/yzhz/archive/2007/07/03/1676796.aspx 一、问题：编码问题是JAVA初学者在web开发过程中经常会遇到问题，网上也有大量相关的
建表后创建表的约束关系和增加表的字段百合不是茶标的约束关系增加表的字段
下面所有的操作都是在表建立后操作的,主要目的就是熟悉sql的约束,约束语句的万能公式 1,增加字段(student表中增加姓名字段) alter table 增加字段的表名 add 增加的字段名增加字段的数据类型 alter table student add name varchar2(10); &nb
Uploadify 3.2 参数属性、事件、方法函数详解 bijian1013 JavaScript uploadify
一.属性属性名称默认值说明 auto true 设置为true当选择文件后就直接上传了，为false需要点击上传按钮才上传。 buttonClass ” 按钮样式 buttonCursor ‘hand’ 鼠标指针悬停在按钮上的样子 buttonImage null 浏览按钮的图片的路
精通Oracle10编程SQL(16)使用LOB对象 bijian1013 oracle 数据库 plsql
/* *使用LOB对象 */ --LOB(Large Object)是专门用于处理大对象的一种数据类型，其所存放的数据长度可以达到4G字节 --CLOB/NCLOB用于存储大批量字符数据，BLOB用于存储大批量二进制数据，而BFILE则存储着指向OS文件的指针 /* *综合实例 */ --建立表空间 --#指定区尺寸为128k,如不指定，区尺寸默认为64k CR
【Resin一】Resin服务器部署web应用 bit1129 resin
工作中，在Resin服务器上部署web应用，通常有如下三种方式：配置多个web-app 配置多个http id 为每个应用配置一个propeties、xml以及sh脚本文件配置多个web-app 在resin.xml中,可以为一个host配置多个web-app <cluster id="app&q
red5简介及基础知识白糖_ 基础
简介 Red5的主要功能和Macromedia公司的FMS类似，提供基于Flash的流媒体服务的一款基于Java的开源流媒体服务器。它由Java语言编写，使用RTMP作为流媒体传输协议，这与FMS完全兼容。它具有流化FLV、MP3文件，实时录制客户端流为FLV文件，共享对象，实时视频播放、Remoting等功能。用Red5替换FMS后,客户端不用更改可正
angular.fromJson boyitech AngularJS AngularJS 官方API AngularJS API
angular.fromJson 描述: 把Json字符串转为对象使用方法: angular.fromJson(json); 参数详解: Param Type Details json string JSON 字符串返回值: 对象, 数组, 字符串或者是一个数字示例: <!DOCTYPE HTML> <h
java-颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I bylijinnan java
public class ReverseWords { /** * 题目：颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I.词以空格分隔。 * 要求： * 1.实现速度最快,移动最少 * 2.不能使用String的方法如split,indexOf等等。 * 解答：两次翻转。 */ publ
web实时通讯 Chen.H Web 浏览器 socket 脚本
关于web实时通讯，做一些监控软件。由web服务器组件从消息服务器订阅实时数据，并建立消息服务器到所述web服务器之间的连接，web浏览器利用从所述web服务器下载到web页面的客户端代理与web服务器组件之间的socket连接，建立web浏览器与web服务器之间的持久连接；利用所述客户端代理与web浏览器页面之间的信息交互实现页面本地更新，建立一条从消息服务器到web浏览器页面之间的消息通路
[基因与生物]远古生物的基因可以嫁接到现代生物基因组中吗? comsci 生物
大家仅仅把我说的事情当作一个IT行业的笑话来听吧..没有其它更多的意思如果我们把大自然看成是一位伟大的程序员,专门为地球上的生态系统编制基因代码,并创造出各种不同的生物来,那么6500万年前的程序员开发的代码,是否兼容现代派的程序员的代码和架构呢?
oracle 外部表 daizj oracle 外部表 external tables
oracle外部表是只允许只读访问，不能进行DML操作，不能创建索引，可以对外部表进行的查询，连接，排序，创建视图和创建同义词操作。 you can select, join, or sort external table data. You can also create views and synonyms for external tables. Ho
aop相关的概念及配置 daysinsun AOP
切面(Aspect): 通常在目标方法执行前后需要执行的方法（如事务、日志、权限），这些方法我们封装到一个类里面，这个类就叫切面。连接点（joinpoint） spring里面的连接点指需要切入的方法，通常这个joinpoint可以作为一个参数传入到切面的方法里面（非常有用的一个东西）。通知（Advice）通知就是切面里面方法的具体实现，分为前置、后置、最终、异常环
初一上学期难记忆单词背诵第二课 dcj3sjt126com english word
middle 中间的，中级的 well 喔，那么；好吧 phone 电话，电话机 policeman 警察 ask 问 take 拿到；带到 address 地址 glad 高兴的，乐意的 why 为什么 China 中国 family 家庭 grandmother (外)祖母 grandfather (外)祖父 wife 妻子 husband 丈夫 da
Linux日志分析常用命令 dcj3sjt126com linux log
1.查看文件内容 cat -n 显示行号 2.分页显示 more Enter 显示下一行空格显示下一页 F 显示下一屏 B 显示上一屏 less /get 查询"get"字符串并高亮显示 3.显示文件尾 tail -f 不退出持续显示 -n 显示文件最后n行 4.显示头文件 head -n 显示文件开始n行 5.内容排序 sort -n 按照
JSONP 原理分析 fantasy2005 JavaScript jsonp jsonp 跨域
转自 http://www.nowamagic.net/librarys/veda/detail/224 JavaScript是一种在Web开发中经常使用的前端动态脚本技术。在JavaScript中，有一个很重要的安全性限制，被称为“Same-Origin Policy”（同源策略）。这一策略对于JavaScript代码能够访问的页面内容做了很重要的限制，即JavaScript只能访问与包含它的
使用connect by进行级联查询 234390216 oracle 查询父子 Connect by 级联
使用connect by进行级联查询 connect by可以用于级联查询，常用于对具有树状结构的记录查询某一节点的所有子孙节点或所有祖辈节点。来看一个示例，现假设我们拥有一个菜单表t_menu，其中只有三个字段：
一个不错的能将HTML表格导出为excel,pdf等的jquery插件 jackyrong jquery插件
发现一个老外写的不错的jquery插件，可以实现将HTML 表格导出为excel,pdf等格式，地址在： https://github.com/kayalshri/ 下面看个例子，实现导出表格到excel,pdf <html> <head> <title>Export html table to excel an
UI设计中我们为什么需要设计动效 lampcy UI UI设计
关于Unity3D中的Shader的知识首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，
如何禁止页面缓存 nannan408 html jsp cache
禁止页面使用缓存~ ------------------------------------------------ jsp:页面no cache： response.setHeader("Pragma","No-cache"); response.setHeader("Cache-Control","no-cach
以代码的方式管理quartz定时任务的暂停、重启、删除、添加等 Everyday都不同定时任务管理 spring-quartz
【前言】在项目的管理功能中，对定时任务的管理有时会很常见。因为我们不能指望只在配置文件中配置好定时任务就行了，因为如果要控制定时任务的 “暂停” 呢？暂停之后又要在某个时间点 “重启” 该定时任务呢？或者说直接 “删除” 该定时任务呢？要改变某定时任务的触发时间呢？ “添加” 一个定时任务对于系统的使用者而言，是不太现实的，因为一个定时任务的处理逻辑他是不
EXT实例 tntxia ext
（1）增加一个按钮 JSP: <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); Stri
数学学习在计算机研究领域的作用和重要性 xjnine Math
最近一直有师弟师妹和朋友问我数学和研究的关系，研一要去学什么数学课。毕竟在清华，衡量一个研究生最重要的指标之一就是paper,而没有数学，是肯定上不了世界顶级的期刊和会议的，这在计算机学界尤其重要！你会发现，不论哪个领域有价值的东西，都一定离不开数学！在这样一个信息时代，当google已经让世界没有秘密的时候，一种卓越的数学思维，绝对可以成为你的核心竞争力. 无奈本人实在见地

利用Flink在大数据领域实现实时推荐系统