御风@户外

Parallel Computing 并行计算相关学习

参考资料
https://hpc.llnl.gov/documentation/tutorials
https://hpc.llnl.gov/documentation/tutorials/introduction-parallel-computing-tutorial
https://hpc-tutorials.llnl.gov/openmp/
https://www.openmp.org/

Parallel Computing 并行计算
并行计算的基本概念、用途、概念和术语、并行存储体系结构和编程模型等主题。

Serial Computing 串行计算：

Parallel computing 并行计算:

问题可被分解为可并行的离散工作片段。
有多个计算资源：单台机器的多核，多台计算机。

Parallel Computers 并行计算机

下面的示意图展示了一个典型的LLNL并行计算机集群：
每个计算节点本身就是一个多处理器的并行计算机
多个计算节点通过Infiniband网络连接在一起
还有用于其他目的的专用节点，同样是多处理器的

更好地利用底层并行硬件
现代计算机，甚至是笔记本电脑，都采用多核心的并行体系结构。
并行软件专门设计用于支持多核心、多线程等并行硬件。
在大多数情况下，串行程序在现代计算机上运行会“浪费”潜在的计算能力。

冯·诺依曼体系结构以匈牙利数学家约翰·冯·诺伊曼（John von Neumann）的名字命名
“存储程序计算机” - 程序指令和数据都存储在电子内存中。
并行计算机仍然遵循这一基本设计。

弗林经典分类法Flynn’s Classical Taxonomy

单指令流单数据流（SISD）
串行（非并行）计算机
单一指令：在任何时钟周期内 CPU 只执行一个指令流
单一数据：在任何时钟周期内只使用一个数据流作为输入
确定性执行Deterministic execution

单指令流多数据流（SIMD）
一种并行计算机类型
单一指令：所有处理单元在任何给定时钟周期内执行相同的指令
多数据：每个处理单元可以操作不同的数据元素
最适用于具有高度规律性的专业问题，如图形/图像处理。
同步（锁步）和确定性执行
两种变体：处理器阵列和矢量流水线
示例：
处理器阵列：Thinking Machines CM-2，MasPar MP-1 和 MP-2，ILLIAC IV
矢量流水线：IBM 9000，Cray X-MP，Y-MP 和 C90，Fujitsu VP，NEC SX-2，Hitachi S820，ETA10
大多数现代计算机，特别是那些配备图形处理器单元（GPU）的计算机使用 SIMD 指令和执行单元。

多指令流单数据流（MISD）
一种并行计算机类型
多指令：每个处理单元通过独立的指令流独立地操作数据。
单一数据：单个数据流被馈送到多个处理单元。
这一类并行计算机几乎没有实际的例子（如果有的话）。
一些可行的用途可能包括：
多个频率滤波器对单一信号流的操作
多个密码算法尝试破解单一的编码消息。

多指令流多数据流（MIMD）
一种并行计算机类型
多指令：每个处理器可以执行不同的指令流
多数据：每个处理器可以使用不同的数据流
执行可以是同步的或异步的，确定性的或非确定性的
目前，最常见的并行计算机类型 - 大多数现代超级计算机属于这一类。
例子：大多数现代超级计算机，网络化的并行计算机集群和“网格”，多处理器SMP计算机，多核PC。
注意：许多MIMD架构还包括SIMD执行子组件。

并行计算的一般术语
与其他领域一样，并行计算有其自己的术语。以下列出了与并行计算相关的一些常用术语。这些术语中的大多数将在后面进行更详细的讨论。

CPU
当代CPU由一个或多个核心组成 - 具有自己的指令流的独立执行单元。具有CPU的核心可以组织成一个或多个插槽 - 每个插槽具有自己独立的内存。当CPU由两个或更多插槽组成时，通常硬件基础设施支持在插槽之间共享内存。
节点 Node
一个独立的“盒中计算机”。通常由多个CPU/处理器/核心、内存、网络接口等组成。节点通过网络连接在一起，构成一个超级计算机。
任务 Task
计算工作的逻辑上离散的部分。任务通常是一个程序或类似程序的一组指令，由处理器执行。并行程序由在多个处理器上运行的多个任务组成。
流水线处理Pipelining
将任务分解为由不同处理单元执行的步骤，输入通过这些步骤流动，类似于流水线装配线；这是一种并行计算的类型。
共享内存 Shared Memory
描述所有处理器都可以直接访问共同物理内存的计算机体系结构。在编程意义上，它描述了一个模型，其中并行任务都有对内存相同“图像”的看法，可以直接寻址和访问相同的逻辑内存位置，而不考虑物理内存实际存在的位置。
对称多处理器（SMP）Symmetric Multi-Processor
多处理器共享内存的硬件体系结构，多个处理器共享单一地址空间，并平等访问所有资源 - 内存、磁盘等。
分布式内存 Distributed Memory
在硬件上，指的是基于网络的内存访问，物理内存不是共享的。作为一种编程模型，任务只能逻辑上“看到”本地机器内存，并且必须使用通信来访问在其他机器上执行其他任务的内存。
通信 Communications
并行任务通常需要交换数据。有几种方法可以实现这一点，例如通过共享内存总线或通过网络。
同步 Synchronization
并行任务的实时协调，通常与通信相关。

同步通常涉及至少一个任务的等待，因此可能导致并行应用的挂钟执行时间增加。

计算颗粒度Computational Granularity
在并行计算中，颗粒度是计算与通信的比率的定量或定性度量。
粗颗粒度：在通信事件之间执行相对较大数量的计算工作
细颗粒度：在通信事件之间执行相对较小数量的计算工作
观察到的加速比Observed Speedup
已经并行化的代码的观察到的加速比，定义为：
```
  串行执行的挂钟时间
  ----------------------
  并行执行的挂钟时间
```

是衡量并行程序性能的最简单和最广泛使用的指标之一。

并行开销 Parallel Overhead
唯一与并行任务相关的执行时间，而不是用于执行有用工作的时间。并行开销可能包括以下因素：
任务启动时间
同步
数据通信
由并行语言、库、操作系统等引起的软件开销
任务终止时间
大规模并行 Massively Parallel
指的是构成给定并行系统的硬件 - 具有许多处理单元。 “许多”的含义不断增加，但目前，最大的并行计算机由数十万到数百万个处理单元组成。
尴尬地（理想地）并行 Embarrassingly (IDEALY) Parallel
同时解决许多相似但独立的任务；任务之间几乎不需要协调。
可伸缩性 Scalability
指的是并行系统（硬件和/或软件）在添加更多资源时能够呈现与并行加速成比例的能力。影响可伸缩性的因素包括：
硬件 - 特别是内存-CPU带宽和网络通信性质
应用算法
与并行开销相关的因素
您特定应用程序的特性

潜在的并行编程收益、限制和成本
阿姆达尔定律 Amdahl’s Law：潜在的程序加速取决于可并行化的代码部分（P）的比例。

其中 P = 可并行部分占比，N = 处理器数量，S = 串行部分占比。
数据量增大时，往往增加了可并行部分P的占比。

API的标准化，如MPI、OpenMP和POSIX线程
MPI（Message Passing Interface）、OpenMP和POSIX线程都是与并行计算相关的编程接口，用于实现并行化的程序设计。

MPI（Message Passing Interface）：
- 定义： MPI是一种消息传递编程模型，用于在分布式内存系统中进行并行编程。它定义了一组库函数，允许多个进程之间相互通信和协作，通常在集群或超级计算机上使用。
- 工作原理： MPI允许进程通过发送和接收消息来进行通信，它提供了点对点通信和集体通信的功能，使得多个进程能够协同解决问题。
- 应用： 主要用于在不同计算节点上的并行任务之间进行通信，适用于大规模、高性能的并行计算。
OpenMP（Open Multi-Processing）：
- 定义： OpenMP是一套用于共享内存系统的编程接口，旨在简化并行程序的编写。它通过在程序中插入编译器指导性语句（pragma）来实现并行化。
- 工作原理： OpenMP使用指导性语句来标识哪些部分的代码可以并行执行。通过在循环、函数等区域添加pragma，编译器可以生成并行化的代码。
- 应用： 适用于共享内存系统，如多核处理器和共享内存计算机。它使得简单的并行任务可以更容易地实现，提高了编写并行程序的便利性。
POSIX线程（Pthreads）：
- 定义： POSIX线程是一种标准的多线程编程接口，用于在同一进程内实现多线程并行。POSIX是IEEE为操作系统提供标准的工作组，而Pthreads是该标准中与线程相关的部分。
- 工作原理： Pthreads提供了创建、同步、互斥等多线程操作的函数。它允许程序员创建多个执行线程，这些线程可以并行执行，共享进程的资源。
- 应用： 适用于多线程编程，可以在单一进程内的多个线程之间共享数据和资源。常用于需要更细粒度的并行性的应用程序。

这些接口可以根据应用程序的需求选择合适的并行编程模型。MPI主要用于分布式内存系统的通信，OpenMP适用于共享内存系统的简单并行化，而POSIX线程则用于在单一进程内实现多线程并行。

共享内存
总体特征：
共享内存并行计算机有很大的变化，但通常都具有所有处理器都能访问所有内存作为全局地址空间的能力。
多个处理器可以独立运行，但共享相同的内存资源。
由一个处理器引起的内存位置的更改对所有其他处理器都是可见的。
从历史上看，共享内存机器被分为UMA和NUMA两类，基于内存访问时间。

统一内存访问（UMA）Uniform Memory Access
今天最常见的是对称多处理器（SMP）机器
相同的处理器
对内存的访问和访问时间相同
有时称为CC-UMA - 缓存一致的UMA。缓存一致意味着如果一个处理器更新共享内存中的位置，所有其他处理器都会知道更新。缓存一致性是在硬件层面完成的。

非统一内存访问（NUMA）Non-Uniform Memory Access
通常由两个或多个SMP物理连接而成
一个SMP可以直接访问另一个SMP的内存
并非所有处理器对所有内存的访问时间都相同
跨链路的内存访问速度较慢
如果保持缓存一致性，也可以称为CC-NUMA - 缓存一致的NUMA

分布式内存
总体特征
与共享内存系统一样，分布式内存系统差异很大，但共享一个共同的特点。分布式内存系统需要一个通信网络来连接处理器间的内存。
处理器有自己的本地内存。一个处理器的内存地址不能映射到另一个处理器，因此在所有处理器之间没有全局地址空间的概念。
由于每个处理器都有自己的本地内存，它可以独立运行。它对本地内存的更改对其他处理器的内存没有影响。因此，缓存一致性的概念不适用。
当一个处理器需要访问另一个处理器的数据时，通常由程序员明确定义数据如何以及何时进行通信。任务之间的同步也是程序员的责任。
用于数据传输的网络“结构”各异，尽管可以简单到以太网。

混合分布式-共享内存Hybrid Distributed-Shared Memory

并行编程模型Parallel Programming Models

目前有几种常见的并行编程模型：
1. 共享内存（无线程）
2. 线程
3. 分布式内存 / 消息传递
4. 数据并行
5. 混合
6. 单程序多数据（SPMD）
7. 多程序多数据（MPMD）
并行编程模型存在于硬件和内存架构之上的抽象层。
尽管这可能并不明显，但这些模型并不特定于特定类型的机器或内存架构。实际上，任何这些模型都可以（理论上）在任何底层硬件上实现。

POSIX线程

由IEEE POSIX 1003.1c标准（1995年）规定。仅限C语言。
是Unix/Linux操作系统的一部分。
基于库
通常称为Pthreads。
非常显式的并行性；需要程序员对细节进行大量关注。
POSIX Threads tutorial: hpc.llnl.gov/sites/default/files/2019.08.21.TAU_.pdf

OpenMP

行业标准，由一组主要的计算机硬件和软件供应商、组织和个人共同定义和支持。
基于编译器指令
可移植 / 多平台，包括Unix和Windows平台
在C/C++和Fortran实现中可用
可以非常简单易用 - 提供“渐进式并行性”。可以从串行代码开始。
其他线程实现也很常见，但这里不讨论：
- Microsoft线程
- Java、Python线程
- 用于GPU的CUDA线程
  OpenMP tutorial: hpc-tutorials.llnl.gov/openmp/

分布式内存 / 消息传递模型Distributed Memory / Message Passing Model
MPI规范 http://www.mpi-forum.org/docs/
Message Passing Interface (MPI) 是消息传递的“事实上的”行业标准。
MPI tutorial: hpc-tutorials.llnl.gov/mpi/

数据并行模型Data Parallel Model

也可能被称为Partitioned Global Address Space分区全局地址空间（PGAS）模型。
数据并行模型展示了以下特征：
- 地址空间被视为全局
- 大多数并行工作集中在对数据集执行操作上。数据集通常组织成一个共同的结构，如数组或立方体。
- 一组任务共同在相同的数据结构上工作，但是每个任务在相同数据结构的不同分区上工作。
- 任务在其工作分区上执行相同的操作，例如“对每个数组元素加4”。
在共享内存架构中，所有任务都可以通过全局内存访问数据结构。
在分布式内存架构中，全局数据结构可以在逻辑上和/或物理上分布在任务之间。

实现：

目前，有几种并行编程实现处于不同开发阶段，基于数据并行/PGAS模型。
Coarray Fortran：Fortran 95的一小组扩展，用于SPMD并行编程。依赖于编译器。更多信息：https://en.wikipedia.org/wiki/Coarray_Fortran
Unified Parallel C（UPC）：C编程语言的扩展，用于SPMD并行编程。依赖于编译器。更多信息：https://upc.lbl.gov/
全局数组：在分布式数组数据结构的上下文中提供共享内存风格的编程环境。具有C和Fortran77绑定的公有领域库。更多信息：https://en.wikipedia.org/wiki/Global_Arrays
X10：由IBM在Thomas J. Watson研究中心开发的基于PGAS的并行编程语言。更多信息：http://x10-lang.org/
Chapel：由Cray领导的开源并行编程语言项目。更多信息：http://chapel.cray.com/

混合模型

将消息传递模型（MPI）与线程模型（OpenMP）结合使用。
线程使用本地的、节点上的数据执行计算密集型内核
不同节点上的进程之间的通信通过MPI在网络上进行
这种混合模型非常适用于目前最流行的硬件环境，即集群化的多/多核机器。
使用MPI与CPU-GPU（图形处理单元）编程。
MPI任务在CPU上使用本地内存运行，并通过网络与彼此通信。
计算密集型内核被卸载到节点上的GPU上。
节点本地内存和GPU之间的数据交换使用CUDA（或类似的东西）。
其他混合模型也很常见：
- MPI与Pthreads
- MPI与非GPU加速器

SPMD和MPMD
单程序多数据（SPMD）

多程序多数据（MPMD）

自动并行化与手动并行化
用于自动并行化串行程序的最常见类型的工具是：并行编译器、预处理器。
完全自动

编译器分析源代码并识别并行性的机会。
该分析包括识别并行性的抑制因素，以及并行性是否实际上会提高性能的成本权衡。
循环（do、for）是自动并行化最频繁的目标。
程序员指导
使用“编译器指令”或可能是编译器标志，程序员明确告诉编译器如何并行化代码。
可能还可以与某些程度的自动并行化结合使用。
最常见的编译器生成的并行化是使用节点上的共享内存和线程（如OpenMP）完成的。
如果您从现有的串行代码开始并且有时间或预算限制，那么自动并行化可能是一个答案。然而，自动并行化有几个重要的警告：
- 可能会产生错误的结果
- 性能实际上可能会下降
- 比手动并行化灵活性差得多
- 仅限于代码的子集（主要是循环）
- 如果编译器分析表明存在抑制因素或代码太复杂，实际上可能不会并行化代码
本节的其余部分适用于手动开发并行代码的方法。

理解问题和程序Understand the Problem and the Program
Programs = algorithms + data + (hardware)

调试Debugging

调试器：
- 线程 - pthreads 和 OpenMP
- MPI
- GPU / 加速器
- 混合
Livermore Computing 用户可以访问安装在 LC 集群上的几个并行调试工具：
- RogueWave Software 的 TotalView
- Allinea 的 DDT
- 英特尔的 Inspector
- 堆栈跟踪分析工具（STAT）Stack Trace Analysis Tool- 在 LLNL 本地开发
所有这些工具都有与之相关的学习曲线。
有关详细信息和入门信息，请参见：
- LC 的网页：hpc.llnl.gov/software/development-environment-software
- TotalView 教程：hpc.llnl.gov/documentation/tutorials/totalview-tutorial

性能分析与调优Performance Analysis and Tuning

Livermore Computing LC 系统上安装的工具：
- LC 的网页，网址为 https://hpc.llnl.gov/software/development-environment-software
- TAU：http://www.cs.uoregon.edu/research/tau/docs.php
- HPCToolkit：http://hpctoolkit.org/documentation.html
- Open|Speedshop：https://www.openspeedshop.org/
- Vampir / Vampirtrace：http://vampir.eu/
- Valgrind：http://valgrind.org/
- PAPI：http://icl.cs.utk.edu/papi/
- mpiP：http://mpip.sourceforge.net/
- memP：http://memp.sourceforge.net/

day15｜前端框架学习和算法 universe_01 前端算法笔记
T22括号生成先把所有情况都画出来，然后（在满足什么情况下）把不符合条件的删除。T78子集要画树状图，把思路清晰。可以用暴力法、回溯法和DFS做这个题DFS深度搜索：每个边都走完，再回溯应用：二叉树搜索，图搜索回溯算法=DFS+剪枝T200岛屿数量（非常经典BFS宽度把树状转化成队列形式，lambda匿名函数“一次性的小函数，没有名字”setup语法糖：让代码更简洁好写的语法ref创建：基本类型的
C++ 计数排序、归并排序、快速排序每天搬一点点砖 c++数据结构算法
计数排序：是一种基于哈希的排序算法。他的基本思想是通过统计每个元素的出现次数，然后根据统计结果将元素依次放入排序后的序列中。这种排序算法适用于范围较小的情况，例如整数范围在0到k之间计数排序步骤：1初始化一个长度为最大元素值加1的计数数组，所有元素初始化为02遍历原始数组，将每个元素值作为索引，在计数数组中对应位置加13将数组清空4遍历计数器数组，按照数组中的元素个数放回到元数组中计数排序的优点和
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
力扣面试题07 - 旋转矩阵茶猫_ leetcode 矩阵算法 c语言
题目：给你一幅由N×N矩阵表示的图像，其中每个像素的大小为4字节。请你设计一种算法，将图像旋转90度。不占用额外内存空间能否做到？示例1:给定matrix=[[1,2,3],[4,5,6],[7,8,9]],原地旋转输入矩阵，使其变为:[[7,4,1],[8,5,2],[9,6,3]]示例2:给定matrix=[[5,1,9,11],[2,4,8,10],[13,3,6,7],[15,14,12,
模拟退火(SA)：如何“故意走错路”，才能找到最优解？小瑞瑞acd 小瑞瑞学数模模拟退火算法 python 启发式算法算法
模拟退火(SA)：如何“故意走错路”，才能找到最优解？图示模拟退火算法如何通过接受较差解（橙色虚线标注）从局部最优（绿色点）逃逸，最终找到全局最优解（紫色点），展示其跳出局部极小值的能力。大家好，我是小瑞瑞！欢迎回到我的专栏！想象一下，你站在一座连绵不绝的山脉中，目标是找到海拔最低的那个山谷。你手上只有一个高度计，视野被浓雾笼罩，只能看清脚下的一小片区域。如果你是一个“贪心”的登山者，你的策略会非
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
图论算法经典题目解析：DFS、BFS与拓扑排序实战周童學数据结构与算法深度优先算法图论
图论算法经典题目解析：DFS、BFS与拓扑排序实战图论问题是算法面试中的高频考点，本博客将通过四道LeetCode经典题目（均来自"Top100Liked"题库），深入讲解图论的核心算法思想和实现技巧。涵盖DFS、BFS、拓扑排序和前缀树等知识点，每道题配有Java实现和易错点分析。1.岛屿数量(DFS遍历)问题描述给定一个由'1'(陆地)和'0'(水)组成的二维网格，计算岛屿的数量。岛屿由水平或
代码随想录算法训练营第三十五天
01背包问题二维题目链接01背包问题二维题解importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannersc=newScanner(System.in);intM=sc.nextInt();intN=sc.nextInt();int[]space=newint[M];int[]value=new
机器学习必备数学与编程指南：从入门到精通 a小胡哦机器学习基础机器学习人工智能
一、机器学习核心数学基础1.线性代数（神经网络的基础）必须掌握：矩阵运算（乘法、转置、逆）向量空间与线性变换特征值分解与奇异值分解(SVD)为什么重要：神经网络本质就是矩阵运算学习技巧：用NumPy实际操作矩阵运算2.概率与统计（模型评估的关键）核心概念：条件概率与贝叶斯定理概率分布（正态、泊松、伯努利）假设检验与p值应用场景：朴素贝叶斯、A/B测试3.微积分（优化算法的基础）重点掌握：导数与偏导
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践 Liudef06小白特殊专栏人工智能 AIGC 架构人工智能 deepseek
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践DeepSeek大模型正重塑游戏开发范式，本文将深入解析如何利用这一革命性技术构建下一代大型游戏，涵盖从架构设计到项目管理的全流程实践。目录DeepSeek游戏引擎核心架构1.1神经符号系统融合架构1.2动态世界生成引擎智能NPC与剧情系统2.1角色人格建模技术2.2动态叙事生成算法大型项目管理体系3.1敏捷-AI混合开发流
量子计算解决气候变化：科学家找到了新方法大力出奇迹985 量子计算
气候变化已成为全球面临的严峻挑战，传统计算方法在应对与之相关的复杂问题时存在诸多局限。而量子计算作为新兴技术，为解决气候变化难题带来曙光。本文深入剖析科学家利用量子计算应对气候变化的新方法。量子计算凭借独特的量子比特与量子特性，在加速气候模型计算、优化模型参数、预测极端天气事件等方面展现出巨大优势。同时，在可再生能源整合、电网管理、碳捕获等实际应用场景中也发挥着重要作用。尽管目前面临硬件和算法等方
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
算法刷题-动态规划之背包问题
1.背包问题之01（4.30）题目描述小明有一个容量为VV的背包。这天他去商场购物，商场一共有NN件物品，第ii件物品的体积为wiwi，价值为vivi。小明想知道在购买的物品总体积不超过VV的情况下所能获得的最大价值为多少，请你帮他算算。输入描述输入第11行包含两个正整数N,VN,V，表示商场物品的数量和小明的背包容量。第2∼N+12∼N+1行包含22个正整数w,vw,v，表示物品的体积和价值。1
2018年中南大学中英翻译某翁
参考：20180827235856533.jpg【1】机器学习理论表明，机器学习算法能从有限个训练集样本上得到较好的泛化【1】Machinelearningtheoryshowsthatmachinelearningalgorithmcangeneralizewellfromfinitetrainingsetsampleslimited有限的infinite无限的【2】这似乎违背了一些基本的逻辑准
时序预测 | MATLAB实现贝叶斯优化CNN-GRU时间序列预测(股票价格预测) Matlab机器学习之心 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、仿真设计、论文复现、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击主页：Matlab科研工作室个人信条：格物致知，期刊达人。内容介绍股票价格预测一直是金融领域一个极具挑战性的课题。其内在的非线性、随机性和复杂性使得传统的预测方法难以取得令人满意的效果。近年来，深度学习技术，特别是卷积神经网络(CNN)和门控循环单元(GRU)的结合，为时
顺时针旋转N * N 的矩阵忆杰算法 Python 矩阵 python 算法
顺时针旋转题目描述数据范围实现逻辑代码实现题目描述有一个NxN整数矩阵，请编写一个算法，将矩阵顺时针旋转90度。给定一个NxN的矩阵，和矩阵的阶数N,请返回旋转后的NxN矩阵。数据范围0852789963'''#第N列逆序后变成第N行#或者是第i行变成第N-i-1列代码实现classSolution:#列转换为行defline2Row(self,mat,n):arr=[]forlineinrang
时序预测 | MATLAB实现BO-CNN-GRU贝叶斯优化卷积门控循环单元时间序列预测 Matlab算法改进和仿真定制工程师 matlab cnn gru
✅作者简介：热爱数据处理、数学建模、算法创新的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍时间序列预测在各个领域都具有重要的应用价值，例如金融市场预测、气象预报、交通流量预测等。准确地预测未来趋势对于决策制定至关重要。近年来，深度学习技术在时间序列预测领域取得了显著进展，其中卷积神经网络(CNN)和门控循环单元(GRU)由于其强
使用Python和Gradio构建实时数据可视化工具 PythonAI编程架构实战家信息可视化 python 开发语言 ai
使用Python和Gradio构建实时数据可视化工具关键词：Python、Gradio、数据可视化、实时数据、Web应用、交互式界面、数据科学摘要：本文将详细介绍如何使用Python和Gradio框架构建一个实时数据可视化工具。我们将从基础概念开始，逐步深入到核心算法实现，包括数据处理、可视化技术以及Gradio的交互式界面设计。通过实际项目案例，读者将学习如何创建一个功能完整、响应迅速的实时数据
【经典面试题】【JVM与性能调优】垃圾回收算法（标记-清除算法/复制算法/标记-整理算法/CMS/G1/ZGC）本本本添哥归档 -Inbox1 001 -基础开发能力面试题目汇总 jvm 算法
JVM自动管理内存，当对象不再被引用时，垃圾回收器（GarbageCollector）会自动释放这些对象占用的内存。标记-清除算法（Mark-Sweep）：标记垃圾再清除，会产生碎片。复制算法（Copying）：将存活对象复制到新区域，适合新生代，无碎片但浪费空间。标记-整理算法（Mark-Compact）：标记后将存活对象移到一端，清除另一端，适合老年代。分代收集算法（GenerationalC
从零到一：基于差分隐私决策树的客户购买预测系统实战开发笙囧同学决策树算法机器学习
作者简介：笙囧同学，中科院计算机大模型方向硕士，全栈开发爱好者联系方式：[email protected]各大平台账号：笙囧同学座右铭：偷懒是人生进步的阶梯文章导航快速导航前言-项目背景与价值项目概览-系统架构与功能技术深度解析-核心算法原理️系统实现详解-工程实践细节性能评估与分析-实验结果分析Web系统开发-前后端开发部署与运维-DevOps实践完整复现指南-手把手教程️实践案例与故障排除-问
CMS垃圾回收器+G1垃圾回收器+ZGC垃圾回收器详解及对比 weixin_43751710 jvm java 算法
一、CMS收集器CMS(ConcurrentMarkSweep)收集器是一种以获取最短回收停顿时间为目标的收集器，是一款针对老年代的垃圾回收器，一般和Parallel回收器（一款新生代回收器，是使用复制算法的收集器，又是并行的多线程收集器，收集时会Stoptheworld）配合使用。1.工作过程从名字（包含“MarkSweep”）上就可以看出CMS收集器是基于标记-清除算法实现的，它的运作整个过程
负载均衡-加权随机算法 BP白朴 Nginx 负载均衡 java 算法服务器
负载均衡-加权随机算法由于访问概率大致相同，所以如果部分服务器性能不一致的话，容易导致性能差的服务器压力过大，所以要根据服务器性能不一致的情况，给性能好的服务器多处理请求，给差的少分配请求（能者多劳）所以就需要在随机算法的基础上给每台服务器设置权重，延伸为加权随机算法1、将应用服务器集群的IP存到Map里,每个IP对应有一个权重2、创建一个List,来将所有权重下的IP存到list里面如：192.
零数学基础理解AI核心概念：梯度下降可视化实战九章云极AladdinEdu 人工智能 gpu算力深度学习 pytorch python 语言模型 opencv
点击“AladdinEdu，同学们用得起的【H卡】算力平台”，H卡级别算力，按量计费，灵活弹性，顶级配置，学生专属优惠。用Python动画演示损失函数优化过程，数学公式具象化读者收获：直观理解模型训练本质，破除"数学恐惧症"当盲人登山者摸索下山路径时，他本能地运用了梯度下降算法。本文将用动态可视化技术，让你像感受重力一样理解AI训练的核心原理——无需任何数学公式推导。一、梯度下降：AI世界的"万有
非欧空间计算加速：图神经网络与微分几何计算的GPU优化（流形数据的内存布局优化策略）九章云极AladdinEdu 空间计算神经网络人工智能 gpu算力算法 java 开发语言
一、非欧空间计算的革命性意义与核心挑战在三维形状分析、社交网络建模、分子动力学模拟等领域，非欧几里得空间数据（流形数据）的处理正推动人工智能技术向更复杂的几何结构迈进。传统欧式空间优化方法在处理流形数据时面临根本性局限：黎曼度量导致距离计算失效、局部坐标系动态变化引发内存访问模式混乱、曲率变化影响并行计算效率。本文提出基于分块流形存储（BlockedManifoldStorage,BMS）与层次化
CMS垃圾回收器和G1垃圾回收器区别_g1cms垃圾回收器区别 2401_89191885 jvm
该类所有的实例都已经被回收，也就是Java堆中不存在该类的任何实例；加载该类的ClassLoader已经被回收；该类对应的java.lang.Class对象没有在任何地方被引用，无法在任何地方通过反射访问该类的方法。3.常见的垃圾回收算法1、Mark-Sweep（标记-清除算法）：（1）思想：标记清除算法分为两个阶段，标记阶段和清除阶段。标记阶段任务是标记出所有需要回收的对象，清除阶段就是清除被标
【数据结构】--ArrayList与顺序表 bubu__ 数据结构数据结构
文章目录1.线性表2.顺序表3.ArrayList简介4.MyArrayList的实现5.ArrayList使用5.1ArrayList的构造5.2ArrayList常见操作5.3ArrayList的遍历5.4ArrayList的扩容机制6.ArrayList的具体使用6.1简单的洗牌算法6.2杨辉三角1.线性表线性表（linearlist）是n个具有相同特性的数据元素的有限序列。线性表是一种在实
分布式全局唯一ID生成：雪花算法 vs Redis Increment，怎么选？
雪花算法vsRedisIncrement：分布式全局唯一ID生成方案深度对比在分布式系统开发中，“全局唯一ID”是绕不开的核心问题。无论是分库分表的数据库设计、订单编号的唯一性保证，还是日志追踪的链路标识，都需要一套可靠的ID生成方案。今天我们就来聊聊两种主流方案——雪花算法（Snowflake）和RedisIncrement，并从原理、特性到适用场景，帮你理清如何选择。同时，我们还将对比其他常见
数据结构2-集合类ArrayList与洗牌算法
文章目录★引言：一.MyArrayList模拟实现（一）IList（二）MyArrayList（1）add(Tdata)（2）add(intpos,Tdata)（3）IllgalPosException（4）indexOf(ObjecttoFind)（5）contains(ObjecttoFind)（6）get(intpos)（7）set(intpos,Tvalue)（8）remove(Objec
解读Servlet原理篇二---GenericServlet与HttpServlet 周凡杨 java HttpServlet 源理 GenericService 源码
在上一篇《解读Servlet原理篇一》中提到，要实现javax.servlet.Servlet接口（即写自己的Servlet应用），你可以写一个继承自javax.servlet.GenericServletr的generic Servlet ，也可以写一个继承自java.servlet.http.HttpServlet的HTTP Servlet（这就是为什么我们自定义的Servlet通常是exte
MySQL性能优化 bijian1013 数据库 mysql
性能优化是通过某些有效的方法来提高MySQL的运行速度，减少占用的磁盘空间。性能优化包含很多方面，例如优化查询速度，优化更新速度和优化MySQL服务器等。本文介绍方法的主要有： a.优化查询 b.优化数据库结构
ThreadPool定时重试 dai_lm java ThreadPool thread timer timertask
项目需要当某事件触发时，执行http请求任务，失败时需要有重试机制，并根据失败次数的增加，重试间隔也相应增加，任务可能并发。由于是耗时任务，首先考虑的就是用线程来实现，并且为了节约资源，因而选择线程池。为了解决不定间隔的重试，选择Timer和TimerTask来完成 package threadpool; public class ThreadPoolTest {
Oracle 查看数据库的连接情况周凡杨 sql oracle 连接
首先要说的是，不同版本数据库提供的系统表会有不同，你可以根据数据字典查看该版本数据库所提供的表。 select * from dict where table_name like '%SESSION%'; 就可以查出一些表，然后根据这些表就可以获得会话信息 select sid,serial#,status,username,schemaname,osuser,terminal,ma
类的继承朱辉辉33 java
类的继承可以提高代码的重用行，减少冗余代码；还能提高代码的扩展性。Java继承的关键字是extends 格式:public class 类名（子类）extends 类名（父类）{ } 子类可以继承到父类所有的属性和普通方法，但不能继承构造方法。且子类可以直接使用父类的public和 protected属性，但要使用private属性仍需通过调用。子类的方法可以重写，但必须和父类的返回值类
android 悬浮窗特效肆无忌惮_ android
最近在开发项目的时候需要做一个悬浮层的动画，类似于支付宝掉钱动画。但是区别在于，需求是浮出一个窗口，之后边缩放边位移至屏幕右下角标签处。效果图如下：一开始考虑用自定义View来做。后来发现开线程让其移动很卡，ListView+动画也没法精确定位到目标点。后来想利用Dialog的dismiss动画来完成。自定义一个Dialog后，在styl
hadoop伪分布式搭建林鹤霄 hadoop
要修改4个文件 1: vim hadoop-env.sh 第九行 2: vim core-site.xml <configuration> &n
gdb调试命令 aigo gdb
原文：http://blog.csdn.net/hanchaoman/article/details/5517362 一、GDB常用命令简介 r run 运行.程序还没有运行前使用 c cuntinue
Socket编程的HelloWorld实例 alleni123 socket
public class Client { public static void main(String[] args) { Client c=new Client(); c.receiveMessage(); } public void receiveMessage(){ Socket s=null; BufferedRea
线程同步和异步百合不是茶线程同步异步
多线程和同步 : 如进程、线程同步，可理解为进程或线程A和B一块配合，A执行到一定程度时要依靠B的某个结果，于是停下来，示意B运行；B依言执行，再将结果给A；A再继续操作。所谓同步，就是在发出一个功能调用时，在没有得到结果之前，该调用就不返回，同时其它线程也不能调用这个方法多线程和异步:多线程可以做不同的事情,涉及到线程通知 &
JSP中文乱码分析 bijian1013 java jsp 中文乱码
在JSP的开发过程中，经常出现中文乱码的问题。首先了解一下Java中文问题的由来： Java的内核和class文件是基于unicode的，这使Java程序具有良好的跨平台性，但也带来了一些中文乱码问题的麻烦。原因主要有两方面，
js实现页面跳转重定向的几种方式 bijian1013 JavaScript 重定向
js实现页面跳转重定向有如下几种方式：一.window.location.href <script language="javascript"type="text/javascript"> window.location.href="http://www.baidu.c
【Struts2三】Struts2 Action转发类型 bit1129 struts2
在【Struts2一】 Struts Hello World http://bit1129.iteye.com/blog/2109365中配置了一个简单的Action，配置如下 <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configurat
【HBase十一】Java API操作HBase bit1129 hbase
Admin类的主要方法注释： 1. 创建表 /** * Creates a new table. Synchronous operation. * * @param desc table descriptor for table * @throws IllegalArgumentException if the table name is res
nginx gzip ronin47 nginx gzip
Nginx GZip 压缩 Nginx GZip 模块文档详见：http://wiki.nginx.org/HttpGzipModule 常用配置片段如下： gzip on; gzip_comp_level 2; # 压缩比例，比例越大，压缩时间越长。默认是1 gzip_types text/css text/javascript; # 哪些文件可以被压缩 gzip_disable &q
java-7.微软亚院之编程判断俩个链表是否相交给出俩个单向链表的头指针，比如 h1 ， h2 ，判断这俩个链表是否相交 bylijinnan java
public class LinkListTest { /** * we deal with two main missions: * * A. * 1.we create two joined-List(both have no loop) * 2.whether list1 and list2 join * 3.print the join
Spring源码学习-JdbcTemplate batchUpdate批量操作 bylijinnan java spring
Spring JdbcTemplate的batch操作最后还是利用了JDBC提供的方法，Spring只是做了一下改造和封装 JDBC的batch操作： String sql = "INSERT INTO CUSTOMER " + "(CUST_ID, NAME, AGE) VALUES (?, ?, ?)";
[JWFD开源工作流]大规模拓扑矩阵存储结构最新进展 comsci 工作流
生成和创建类已经完成,构造一个100万个元素的矩阵模型,存储空间只有11M大,请大家参考我在博客园上面的文档"构造下一代工作流存储结构的尝试",更加相信的设计和代码将陆续推出......... 竞争对手的能力也很强.......,我相信..你们一定能够先于我们推出大规模拓扑扫描和分析系统的....
base64编码和url编码 cuityang base64 url
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.PrintWriter; import java.io.StringWriter; import java.io.UnsupportedEncodingException;
web应用集群Session保持 dalan_123 session
关于使用 memcached 或redis 存储 session ，以及使用 terracotta 服务器共享。建议使用 redis，不仅仅因为它可以将缓存的内容持久化，还因为它支持的单个对象比较大，而且数据类型丰富，不只是缓存 session，还可以做其他用途，一举几得啊。1、使用 filter 方法存储这种方法比较推荐，因为它的服务器使用范围比较多，不仅限于tomcat ，而且实现的原理比较简
Yii 框架里数据库操作详解-[增加、查询、更新、删除的方法 'AR模式'] dcj3sjt126com 数据库
public function getMinLimit () { $sql = "..."; $result = yii::app()->db->createCo
solr StatsComponent（聚合统计） eksliang solr聚合查询 solr stats
StatsComponent 转载请出自出处：http://eksliang.iteye.com/blog/2169134 http://eksliang.iteye.com/ 一、概述 Solr可以利用StatsComponent 实现数据库的聚合统计查询，也就是min、max、avg、count、sum的功能二、参数
百度一道面试题 greemranqq 位运算百度面试寻找奇数算法 bitmap 算法
那天看朋友提了一个百度面试的题目：怎么找出{1,1,2,3,3,4,4,4,5,5,5,5} 找出出现次数为奇数的数字. 我这里复制的是原话，当然顺序是不一定的，很多拿到题目第一反应就是用map,当然可以解决，但是效率不高。还有人觉得应该用算法xxx,我是没想到用啥算法好...！还有觉得应该先排序... 还有觉
Spring之在开发中使用SpringJDBC ihuning spring
在实际开发中使用SpringJDBC有两种方式： 1. 在Dao中添加属性JdbcTemplate并用Spring注入； JdbcTemplate类被设计成为线程安全的，所以可以在IOC 容器中声明它的单个实例，并将这个实例注入到所有的 DAO 实例中。JdbcTemplate也利用了Java 1.5 的特定(自动装箱，泛型，可变长度
JSON API 1.0 核心开发者自述 | 你所不知道的那些技术细节 justjavac json
2013年5月，Yehuda Katz 完成了JSON API(英文，中文) 技术规范的初稿。事情就发生在 RailsConf 之后，在那次会议上他和 Steve Klabnik 就 JSON 雏形的技术细节相聊甚欢。在沟通单一 Rails 服务器库—— ActiveModel::Serializers 和单一 JavaScript 客户端库——&
网站项目建设流程概述 macroli 工作
一.概念网站项目管理就是根据特定的规范、在预算范围内、按时完成的网站开发任务。二.需求分析项目立项　　我们接到客户的业务咨询，经过双方不断的接洽和了解，并通过基本的可行性讨论够，初步达成制作协议，这时就需要将项目立项。较好的做法是成立一个专门的项目小组，小组成员包括：项目经理，网页设计，程序员，测试员，编辑/文档等必须人员。项目实行项目经理制。客户的需求说明书　　第一步是需
AngularJs 三目运算表达式判断 qiaolevip 每天进步一点点学习永无止境众观千象 AngularJS
事件回顾：由于需要修改同一个模板，里面包含2个不同的内容，第一个里面使用的时间差和第二个里面名称不一样，其他过滤器，内容都大同小异。希望杜绝If这样比较傻的来判断if-show or not，继续追究其源码。 var b = "{{", a = "}}"; this.startSymbol = function(a) {
Spark算子：统计RDD分区中的元素及数量 superlxw1234 spark spark算子 Spark RDD分区元素
关键字：Spark算子、Spark RDD分区、Spark RDD分区元素数量 Spark RDD是被分区的，在生成RDD时候，一般可以指定分区的数量，如果不指定分区数量，当RDD从集合创建时候，则默认为该程序所分配到的资源的CPU核数，如果是从HDFS文件创建，默认为文件的Block数。可以利用RDD的mapPartitionsWithInd
Spring 3.2.x将于2016年12月31日停止支持 wiselyman Spring 3
Spring 团队公布在2016年12月31日停止对Spring Framework 3.2.x（包含tomcat 6.x）的支持。在此之前spring团队将持续发布3.2.x的维护版本。请大家及时准备及时升级到Spring
fis纯前端解决方案fis-pure zccst JavaScript
作者：zccst FIS通过插件扩展可以完美的支持模块化的前端开发方案，我们通过FIS的二次封装能力，封装了一个功能完备的纯前端模块化方案pure。 1，fis-pure的安装 $ fis install -g fis-pure $ pure -v 0.1.4 2，下载demo到本地 git clone https://github.com/hefangshi/f

Parallel Computing 并行计算相关学习

你可能感兴趣的:(算法,并行计算)