易寻fly

【GPT4技术揭秘】GPT-4 Architecture,Infrastructure,Training Dataset,Costs,Vision,MoE

本文是对《GPT-4 Architecture,Infrastructure,Training Dataset, Costs, Vision, MoE 》的中文翻译。介绍了GPT-4使用的相关技术，希望对大家有一些帮助。群友分享了总结内容如下：

13T tokens预训练语料（llama和palm是1.4T）
MoE， 16个110B大的模型（更多的experts理论上效果更好但工程难度更高(内存带宽要求高)，更难收敛）采用MoE是对推理成本的节省上的考量
batchsize逐步提高，最终达到60M bs/16experts
25,000个40G的A100训练了90+天（6300万美元/ 用H100可节约至2150万美元）大概率采用了FB16和int8模式使其能在40G机器上训练
预训练context window为8k，经过微调拓展到32k
MQA(多查询注意力，一个头部)减少KV的内存容量（尤其是在对较长序列时有明显作用）
连续批处理提高GPU利用率
采用speculative decoding加速推理
GPT4的视觉编码器和文本编码器是分开的，在文本预训练完成后通过2T token再微调，采用类Flamingo的方式联合视觉模型和文本模型，未对其从头训练。（和开源社区的MLLM思路基本一致）
还有很多关于通讯效率、并行策略、吞吐量上的讨论，感觉搞预训练的时候可以进一步参考下。

0. 引言

1. 模型结构

2. 数据组成

3. 并行策略

4. 训练费用

5.专家权衡

6.推理权衡

7. GPT-4 推理权衡和基础设施

8. GPT-4推理成本

9. Multi-Query Attention

10. Continuous batching

11. 推测性解码

12. 视觉多模态

0. 引言

OpenAI对GPT-4架构保密的原因并不是人类面临着某种生存风险，而是由于他们的工作是可复制的。我们预计Google、Meta、Anthropic、Inflection、Character、腾讯、字节跳动、百度等公司不久将会拥有同GPT-4一样甚至更强的能力。

OpenAI拥有令人惊叹的工程技术，取得了令人难以置信的成果，但他们的解决方案并不神奇。它是一个优雅的解决方案，其中有很多复杂的权衡。模型越来越大只是竞争的一部分。OpenAI最持久的护城河就是他们拥有最多的实际应用、领先的工程人才，并且能够在未来的模型中继续领先于其他公司。

我们从多个渠道收集了大量关于GPT-4的信息，今天我们希望与大家分享。其中包括模型架构、训练基础架构、推理基础架构、参数数量、训练数据集组成、token数量、层数、并行策略、多模态视觉适配、不同权衡背后的思考过程、独特的实现技术，以及他们如何缓解与巨型模型推理相关的一些最大瓶颈。

GPT-4最有趣的地方在于理解他们为什么做出某些架构决定。

此外，我们还将概述A100上GPT-4的训练和推理成本，以及在下一代模型架构中如何扩展到H100。

首先对问题进行陈述。从GPT-3到GPT-4，OpenAI希望模型尺寸扩大100倍，但问题在于成本。密集的transformer模型无法进一步扩展。OpenAI 的GPT-3、Google的PaLM、Meta的LLAMA、TII的Falcon、MosaicML的MPT等模型都使用了Transformer架构。我们可以很容易地列举出50家公司使用Transformer用来训练LLM。这是一个很好的架构，但其在扩展方面存在缺陷。

请参考《The AI Brick Wall – A Practical Limit For Scaling Dense Transformer Models, and How GPT 4 Will Break Past It》中我们关于训练成本的讨论。我们揭秘了OpenAI为GPT-4架构所做的高层次工作，以及各种现有模型的训练成本。

在过去的6个月中，我们已经意识到训练成本已不再重要。

从表面上看训练一个模型需要数千万甚至上亿美元的计算成本，这似乎有些疯狂，但对于这些大公司来说，这只是微不足道的花费。这实际上是一个资本支出项目，规模越大，效果越好。唯一的限制因素是将时间扩展到人类可以获得反馈并修改架构的时间尺度。

未来几年，Google、Meta和OpenAI/Microsoft等多家公司将在价值超过上千亿美元的超级计算机上训练模型。Meta每年在“Metaverse”上烧掉160多亿美元，谷歌每年在各种永远不会有结果的项目上浪费100亿美元。Amazon在Alexa上损失超过500亿美元。加密货币在毫无价值的的项目上浪费了超过1000亿美元。

这些公司和整个社会可以并将花费超过1000亿美元来制造能够训练单一大模型的超级计算机。然后，这些大模型可以以各种方式产品化。这项工作将在多个国家和公司重复进行。这是新的“太空竞赛”。与之前的浪费不同之处在于，AI将在短期内在人类助手和自主代理方向产生直接价值。

在扩展AI方面最重要的问题是推理，目标是将推理计算与训练计算解耦。这就是模型部署时，需要训练 Chinchilla是最优选择的原因。所以会选择稀疏架构以保证并不是所有参数都会被激活。

真正的难点在于，将这些模型推广到用户和代理的成本太高。推理的成本是训练成本的数倍。这正是OpenAI在模型架构和基础设施方面的创新目标。

大模型的推断是一个多变量问题，在这个问题上，模型的大小对密集模型来说是致命的，在《On Device AI – Double-Edged Sword》中详细讨论了边缘问题，这个问题表现于数据中心非常相似。简单来说，设备永远不可能为LLM提供足够的内存带宽来达到一定的吞吐量。即使有足够的带宽，边缘硬件计算资源的利用率也会非常低。

在数据中心和云计算中，利用率就是一切。NVIDIA的软件备受赞誉，一半原因在于在GPU的几代生命周期中，Nvidia不断更新底层软件，通过在芯片周围、芯片之间和内存中更智能的移动数据来提高FLOPS利用率。

在当前大多是应用案例中，LLM推理都是作为实时助手使用，这意味着它必须达到足够高的吞吐量，以便用户能够实际使用它。人类的平均阅读速度为250/min，但有些人的阅读速度高达1000/min。这意味着LLM的推理速度至少应该是8.33token/s，更近一步需要达到33.33token/s才能覆盖所有的情况。

由于内存带宽的限制，在即使是最新的Nvidia H100 GPU服务也达到实现数万亿参数的密集模型数学计算所要求的吞吐量。每个生成的Token都需要将参数从内存加载到芯片。然后将生成的token送入prompt，然后生成下一个token，此外，attention的KN缓存中的数据流也需要额外的带宽。

上图展示了在足够高吞吐量的情况下，为满足单个用户的需求LLM所需内存带宽与模型参数之间的关系。事实证明，即使是8*H100也无法支撑1万亿参数的密集模型达到33.33token/s的服务。

此外，8*H100的FLOPS利用率在20token/s的情况下忍将低于5%，导致推理成本高的可怕。实际上，对于目前的8路张亮6并行的H100系统来说，推理限制在~3000亿个前向参数左右。

然而，OpenAI正在用A100s实现人类的阅读速度，其模型参数超过1万亿个，而且他们亿每1000个token仅0.06美元的低价广泛提供。这是因为它是稀疏的，并非所有参数都参与计算。

1. 模型结构

GPT-4的规模是CPT-3的10倍之多。我们认为，与GPT-3的1750亿参数相比，GPT-4有120层参数量约为1.8万亿。

OpenAI通过采用专家混合（MoE）模式来保持合理的成本。关于MoE请参考《The AI Brick Wall – A Practical Limit For Scaling Dense Transformer Models, and How GPT 4 Will Break Past It》。

此外，OpenAI使用了16个专家，每个专家的MLP参数约为111B。其中2个专家路由到每个前向计算过程。

虽然文献中提到了很多先进的路由算法，用于选择将每个token给哪些专家，但OpenAI的路由算法据称非常简单，适用于当前的GPT-4模型。

此外，大约有55B个attention共享参数。

每个前向推理（生成1个token）仅使用~280B参数和560TFLOP。相比之下，密集模型每次前向推理需要约1.8w亿个参数和3700TFLOP。

2. 数据组成

OpenAI在约13万亿个Token上训练了GPT-4。鉴于RefinedWeb的CommonCrawl包含约1.5万亿个高质量token，这是有道理的。作为参考，Deepmind的Chinchilla和Google的PaLM模型分别用~1.4万亿个和~0.78万亿个token进行了训练。即使是PaLM 2，据称也是使用~5万亿个token进行训练。

该数据集并非13万亿个唯一的token。相反，由于缺乏高质量的token，数据集包含了多个epoch。基于文本的数据有2个epoch，基于代码的数据有4个epoch。有趣的是，这远远低于Chinchilla的最佳值，表明需要双倍的token数量用于模型训练。这表明网络上缺乏网络上缺乏易于获取的token。高质量的token数量是现有token的1000倍，音频和视觉token数量甚至更多，但这些token的来源并不像互联网爬虫那么简单。

来自ScaleAI和内部的指令微调数据多达数百万行。遗憾的是，我们无法获取关于RLHF数据更多的信息。

预训练阶段上下文长度（seqlen）为8k。GPT-4的32K seqlen版本是基于预训练后对8K的微调。

OpenAI使用的批量大小为6000万！当然，由于并非每个专家都能看到所有token，因此每个专家“只能”看到750w个token。

3. 并行策略

所有A100 GPU的并行化策略至关重要。他们采用了8路张量并行，因为这是NVLink的极限。除此之外，我们听说他们还使用了15路流水线并行。从理论上讲，考虑到通讯与计算时间的对比，这样的流水线数量过多，但如果他们的内存容量受到限制，那么这样做事合理的。

在纯流水线+张量并行的情况下，每个GPU FP16的参数就有~30GB。一旦加上KV缓存和开销，如果OpenAI大部分GPU都是40GB的A100，那么理论上这是合理的。他们很可能使用了ZeRo第一阶段。他们有可能使用了块级FSDP，或者混合共享数据并行。

至于他们为什么不使用全模型FSDP，可能是因为通信开销较大。虽然OpenAI在大多数节点之间都有高速网络，但不一定在所有节点之间都有高速网络。我们相信，至少有一些集群的连接带宽要比其他集群低得多。

我们不明白他们是如何在如此高的流水线并行下避免每个batch产生巨大的bubbles。似乎他们只承担了成本。

4. 训练费用

OpenAI的GPT-4训练FLOPS约为2.15e25，在约25,000个A100上运行90~100天，MFU约为32%到36%。这种极低的利用率部分是由于需要重新启动检查的的故障数量过多。上述泡沫的成本极高。

另一个原因是，在如此多的GPU之间进行all-reduce的成本极高。如果向我们所猜测的那样，集群实际上是一堆较小的集群，它们之间的联网能力要弱得多，那么情况就更是如此。

如果云计算的成本约为A100 1$/h，那么仅此次运行的训练成本约为6300万美元。这还不包括所有的实验、失败的训练、以及数据收集、RLHF、员工等其他成本。由于这些因素，实际成本要高得多。此外这还意味着你需要找人购买芯片、网络、数据中心，承担资本支出，然后租给你。

如今，预训练可以使用~8,192块H100训练55天来完成，H100按2$/h计算，总费用将为2,150万美元。请注意，我们相信到今年年底将会有9家公司拥有更多的H100。并非所有公司都会将其全部用于单一的训练使用，但哪些如此做的公司将拥有更大的模型。到今年年底，Meta将拥有超过100,000个H100，但相当数量的H100将分布在其数据中心进行推理。他们最大的单个集群仍将远远超过25,000个H100。

到今年年底，很多公司将拥有训练GPT-4规模模型的计算资源。

5.专家权衡

MoE是一种在推理过程中减少参数数量的好方法，同时还能增加参数数量，这对每个训练每个token编码更多信息是必须的。这是必要的，因为获得足够多的高质量token是及其困难的。如果OpenAI真的想达到Chinchilla最优，他们就必须在2倍的token上进行训练。

尽管如此，OpenAI还是做了多种权衡。例如，MoE在推理过程中处理起来非常困难，因为并非模型的每一部分都会在每一次token生成中都会被使用。这意味着当其他部分被使用时，某些部分可能处于休眠状态。在为用户提供服务时，这确实会损害利用率。

研究表明，使用64至128名专家比使用16名专家能取得更好的损失效果，但这纯粹是研究结果。使用较少专家有多种原因。OpenAI选择16名专家的一个原因是，更多的专家在许多任务中难以实现泛化。更多的专家也更难以实现收敛面对如此大的训练量，OpenAI选择在专家数量上更加保守。

此外，使用较少的专家也有助于他们的推理基础架构。在转向混合专家推理架构时，需要进行各种复杂的权衡。让我们先来了解一下LLMS推理的基本权衡，然后再来看OpenAI面临的问题以及他们做出的选择。

6.推理权衡

在开始之前，作为一个旁观者，我们想指出的是，我们接触过的每一家LLM公司都认为Nvidia的FasterTransformer推理库非常糟糕，而TensorRT甚至更糟由于无法使用Nvidia的模板并对其进行修改，这意味着人们需要从头开始创建自己的解决方案。对于正在阅读这篇文章的Nvidia公司来说，你们需要尽快为LLM推理解决这个问题，否则事实将成为一个开放的工具，可以更容易地添加第三方硬件支持。巨大的模型浪潮即将到来。如果在推理阶段没有软件优势，或需要从头写kernel，那么AMD的MI300或其他硬件将会有更大的市场。

对于大模型推理在batchsize维度（同时服务用户的数量）和使用芯片数量，有3个方面需要权衡。

延迟-模型必须在合理的延迟内响应。在聊天应用程序中，人类不希望等待数秒后才开始流式输出。预填充 (输入token)和解码 (输出token) 需要不同的处理时间。
吞吐量-模型必须每秒输出一定数量的token。人类使用时需要每秒大约30 token/s。对于其他各种用例，较低或较高的吞吐量也是可以的。
利用率-运行模型的硬件必须达到高利用率，否则成本太高。虽然可以利用较高的延迟和较低的吞叶量将更多的用户请求组合在一起，从而实现更高的利用率，但这也会使其变得更加困难。

LLM推理需要平衡两个要点: 内存带宽和计算量。用最简单的话来说，每个参数都必须被读取，并且有2个FLOP与之相关。因此，大多数芯片的比率 (H100SXM只有3TB/s的内存带宽，但FP8却有2.000 TFLOP/s) 对于批量规模为1的推理来说是完全不平衡的。如果只为1个用户提供服务，即批量规模为1，那么每次token生成的每个参数流所需的内存带宽将支配推理时间。计算时间几乎为零。

要将大型语言模型有效地扩展到众多用户，批量大小必须超过1.多个用户分摊参数读取成本。例如，当批量大小为256或512时，每读入一个字节的内存就有512 FLOP/s或1024 FLOP/s。这个比率更接近H100的内存带宽与FLOPS的比率。这有助于实现更高的利用率，但也带来了更高延迟的缺点。

许多人认为内存容量是LLM推理的主要瓶颈，因为模型的大小可以容纳在许多芯片上，但这是不正确的。虽然大型模型需要多个芯片进行推理，而且更高的内存容量就可以使用更少芯片，然而使用更多的芯片会更好没因为这样可以降低延迟，提高吞吐量，并使用更大的batchsize来提高利用率。

谷歌在其PaLM推理论文中展示了这些权衡。然而，值得注意的是，这是针对像PaLM这样的密集模型，而不是像GPT- 4这样的稀疏模型。

如果一个应用需要尽可能低的延迟，我们就需要应用更多的芯片，并以尽可能多的方式对模型进行分区。较小的批量可以实现较低的延迟，但较小的批量也会导致较差的MFU利用率，从而导致每个token的总成本较高以芯片秒数或美元计算)。
如果该应用为离线推理，并不考虑延迟，那么主要目标是最大化每个芯片的吞吐量（即最小化每个token的成本）。增加batch size是最明智的做法，因为batch size越大，MFU越高。但在某些情况下，更大的batch size并不会更高效。

更多的芯片和更大的批量是最便宜的，因为这样可以提高利用率，但同时也引入了第三个变量，即联网时间。在芯片间拆分模型的某些方法在延迟方面更为经济，但会影响利用率。

存储时间的权重加载部分和非关注计算时间都与模型大小成正比，与芯片数量成反比。然而，对于给定的分区布局，芯片到芯片通信所需的时间随着芯片数量的增加而减少 (或根本不减少) ，因此随着芯片数量的增加，芯片到芯片通信成为一个越来越重要的瓶颈。

虽然我们今天只是简单地讨论一下，但应该注意的是，KV缓存的内存需求会随着批量大小和seglen的增长而爆炸性增长。

如果应用需要生成具有较长注意力上下文的文本，则会大大增加推理时间。对于具有多头注意力的500B+模型，注意力KV缓存会变得很大:对于批量大小512和上下文长度2048，KV缓存总计3TB，是模型参数大小的3倍。在芯片计算核心基本处于空闲状态时，每生成一个token，片上存储器就需要从片外存储器加载一次KV缓存。

较长的序列长度对内存带宽和内存容量的影响尤为严重。OpenAI的16k seglenGPT 3.5 turbo和32k seglen GPT 4由于内存限制无法使用更大的批量，因此成本更高。

较小的批次规模会降低硬件利用率。此外，随着序列长度的增加，KV缓存也会膨胀，KV缓存不能再用户之间共享，因此需要单独读取内存，进一步限制了内存带宽。

7. GPT-4 推理权衡和基础设施

上述所有问题对于GPT-4推理来说都很困难，但作为专家混合物（MoE）的模型结构，则带来了一系列全新的问题。每个token前向传递可以路由到不同的专家集。在批量较高的情况下，吞吐量、延迟和利用率之间的权衡会受到影响。

OpenAI的GPT-4有16个专家，每个前向通道有2个专家。这意味着，如果批量大小为8，则每个专家读取的参数可能只有批量大小1。更糟糕的是，这可能意味着一名专家的批量大小为8，而其他专家的批量大小可能为4、1或0。每生成一个token，路由算法就会向不同的方向发送前向传递，从而导致token到token延迟以及专家批量大小的显著变化。

推理基础设施是OpenAI采用更少专家数量的主要原因。如果他们使用更多专家，内存带宽将进一步限制推理。OpenAI的推理集群经常会达到4k+的批量大小，这意味着即使在专家之间实现了最佳负载均衡，专家的批量大小也只有约500。这需要非常大的使用量才能实现。

我们的理解是，OpenAI在一个由128个GPU组成的集群上运行推理。他们在多个数据中心和地区拥有多个这样的集群。推理以8路张量并行和16路流水线并行的方式进行。8个GPU的每个节点仅有约130B的参数，或在FP16下每个GPU少于30GB，在FP8/int8下少于15GB。这使得推理可以在40GB的A100上运行只要所有批次的KV缓存大小不会过大。

包含各种专家的单个层不会在不同的节点上分解，因为这会使网络tramc太不规则，并且在每个token生成之间重新计算KV缓存的成本太高。对于任何未来的MIoE模型扩展和条件路由，最大的困难是如何处理KV缓存周围的路由。

层数为120，因此在15个不同的节点中进行下潜是很简单的，但由于第一个节点需要进行数据加载和嵌入，因此在推理集群的首节点上设置较少的层数是合理的。此外，还有一些关于推测解码的杂音。这也解释了为什么头节点需要包含更少的层。

8. GPT-4推理成本

尽管GPT-4的前馈参数仅为175B参数Davinchi模型的1.6倍，但其成本却是后者的3倍。这主要是由于GPT-4需要更大的集群和更低的利用率。

我们认为，128个A100推断GPT-4 8k seglen每1k token的成本为0.0049美分，128个H100推断GPT-4 8k seglen每1k token的成本为0.0021美分。需要注意的是，我们假设利用率很高，并保持较高的批量规模。

这可能是一个错误的假设，因为很明显OpenAI有时利用率很低。我们假定OpenAI在低谷时段关闭集群，并重新利用这些节点，从检查点恢复训练，用于尝试各种新技术的小型测试模型。这有助于保持较低的推理成本。如果OpenAI不这样做，他们的利用率会更低，我们的成本估计会增加一倍以上

9. Multi-Query Attention

MQA是每个人都在做的事情，但我们想指出OpenAI也在做。长话短说，只需要一个磁头，KV缓存的内存容量可以大大减少。即便如此，32k seqlen GPT-4肯定无法在40GB的A100上运行，而且8k是有最大批量上限的。如果没有它，8K的最大批处理容量将被大幅限制，以至于不划算。

10. Continuous batching

OpenAI实现了可变批量大小和连续批量。这是为了允许一定程度的最大延迟以及优化推理成本。如果您不熟悉这个概念，AnyScale的这一页值得一读.

11. 推测性解码

我们从一些可靠的人那里听说，OpenAI在GPT-4推理上使用了推测解码。我们不确定这是否属实。token到token的延迟以及简单检索任务与更复杂任务之间的差异似乎表明这是可能的，但有太多的变量需要了解。为了以防万一，我们将使用"Accelerating LLM Inference with Staged Speculative Decoding "中的一些文字，并稍作修改/添加一些颜色，在此对其进行解释。

使用LLMs通常分为两个阶段。首先是预填充，通过模型运行提示，生成KV缓存和第一个输出logits (可能token输出的概率分布) 。这通常是快速的因为整个提示可以并行处理

第二阶段是解码。从输出的logits中选择一个标记并反馈到模型中，由模型生成下一个标记的logits。如此反复，直到生成所需的标记数。由于每次必须按顺序对流经计算单元的权重进行解码才能生成单个token，因此当小批量运行时，第二阶段的算术强度（即计算的 FLOP/内存带宽的字节）非常低。因此，解码通常是自回归生成中最昂贵的部分。

这就是为什么在OpenAI的API调用中，输入token比输出token便宜得多。推测解码的基本思想是使用一个较小、较快的 drai 模型提前解码几个token，然后将它们作为一个批次输入 Oracle 模型。如果Drafi模型的预测是正确的_-较大的模型也同意--那么就可以用一个批次解码多个token，这就为每个token节省了大量的内存带宽，从而节省了时间。

然而，如果较大的模型剔除了Draf模型预测的token，那么剩下的批次将被丢弃，算法自然恢复到标准的逐个token解码。投机解码也可以采用拒绝采样方案，从原始分布中采样。请注意，这仅在带宽成为瓶颈的小批量设置中有用

推测性解码以计算换取带宽。推测解码是一个有吸引力的性能工程目标有两个关键原因。首先，它完全不会降低模型质量。其次，它提供的增益通常与其他方法正交，因为它的性能来自于将顺序执行转换为并行执行。

目前的推测方法预测批次的单一序列。然而，这并不能很好地扩展到大批量或低Draf模型排列。从直观上看，两个模型对长的连续的标记序列达成一致的概率是指数级低的，这意味着随着算术强度的增加，推测解码的收益会迅速降低。

我们认为，如果OpenAI正在使用推测解码，那么他们很可能只将其用于约4个token的序列。作为一个旁观者，降低GPT-4质量的整个阴谋可能只是因为他们让Ocracle模型接受来自推测解码模型的低概率序列。另一个旁证是，有些人猜测bard使用了推测性解码，因为谷歌会等待整个序列生成后再将其发送给用户，但我们不相信这种推测是真的。

12. 视觉多模态

视觉多模态功能是GPT-4最不令人印象深刻的部分，至少与领先的研究相比是如此。当然，目前还没有人将多模态LLM的研究成果商业化。

它是一个独立于文本编码器的视觉编码器，但存在交叉关注。我们听说其架构与Flamingo类似。它在GPT-4的1.8T之上增加了更多参数。在仅对文本进行预训练的基础上，又对约2万亿个token进行了微调。

在视觉模型方面，OpenAI希望从头开始训练，但该模型还不够成熟，因此他们希望从文本入手来降低风险。

他们训练的下一个型号GPT-5，据称将从头开始进行视觉训练，并能自行生成图像。此外，它还将能够进行音频处理。

这种视觉能力的主要目的之一是让自主代理能够阅读网页并转录图像和视频中的内容。他们训练的一些数据是联合数据 (渲染的LaTeX/文本) 、网页截图YouTube视频:取样帧，并围绕其运行Whisper以获得转录。

所有这些对LLM的过度优化的一个有趣之处在于，视觉模型的IO成本与文本模型的IO成本不同。在文本模型上，正如我们在Amazon Cloud Crisis一文中所描述的，IO成本极低。在视觉模型上，数据加载的IO成本要高出约150倍每个标记 600 字节，而不是文本的 4 字节。在图像压缩方面正在开展大量工作。

这对于那些在2-3年后围绕LLM的用例和比率优化硬件的硬件供应商来说极为重要。他们可能会发现自己身处的世界中，每个模型都具有强大的视觉和音频功能。他们可能会发现自己的架构适应性很差。总体而言，架构肯定会超越我们目前看到的基于文本的简化密集型和/或MIoE模型。

你可能感兴趣的:(nlp,chatgpt,人工智能)

为了在未来的人工智能世界中取得成功，学生们必须学习人类写作的优点睿邸管家
澳大利亚各地的学生在新学年开始使用铅笔、钢笔和键盘学习写字。在工作场所，机器也在学习写作，如此有效，几年之内，它们可能会写得比人类更好。有时它们已经做到了，就像Grammarly这样的应用程序所展示的那样。当然，人类现在的日常写作可能很快就会由具有人工智能(AI)的机器来完成。手机和电子邮件软件常用的预测文本是无数人每天都在使用的一种人工智能写作形式。据AI行业研究机构称，到2022年，人工智能及
人工智能应用研究快讯 2021-11-30 峰谷皆平
[HTML]ArtificialIntelligenceforSkinCancerDetection:ScopingReviewATakiddin,JSchneider,YYang,AAbd-Alrazaq...JournalofMedicalInternet...,2021ABSTACT:Background:Skincanceristhemostcommoncancertypeaffectin
从振动信号到精准预警：AI 如何重塑工业设备健康管理？缘华工业智维人工智能计算机视觉边缘计算信息与通信
在智能制造浪潮席卷全球的当下，工业生产正经历着从传统模式向智能化、数字化转型的深刻变革。在这场变革中，AI驱动的振动分析技术犹如一颗璀璨新星，成为工业设备可靠运行的“健康卫士”。它通过在设备关键部位部署振动传感器，如同医生为患者听诊般实时采集设备运行时的振动信号，再借助强大的人工智能算法对这些“工业脉搏”进行深度解析，从而实现对工业设备从故障预警到寿命预测的全周期精准守护。一、AI振动分析：设备状
AI 生成虚拟宠物：24 小时陪你聊天解闷大力出奇迹985 人工智能宠物
本文围绕AI生成虚拟宠物展开，介绍这类依托人工智能技术诞生的虚拟伙伴，能实现24小时不间断陪伴聊天，为人们解闷。文中详细阐述其技术基础，包括自然语言处理、机器学习等；分析多样功能，如个性化互动、情绪回应等；探讨在独居人群、压力大者等不同群体中的应用场景，最后总结其为人们生活带来的积极影响及未来发展潜力，展现AI虚拟宠物在陪伴领域的独特价值。一、AI生成虚拟宠物的诞生背景与技术基石在快节奏的现代社会
GPT-4 在 AIGC 中的微调技巧：让模型更懂你的需求 AIGC应用创新大全 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 AIGC ai
GPT-4在AIGC中的微调技巧：让模型更懂你的需求关键词：GPT-4、AIGC、模型微调、监督学习、指令优化、过拟合预防、个性化生成摘要：AIGC（人工智能生成内容）正在重塑内容创作行业，但通用的GPT-4模型可能无法精准匹配你的垂直需求——比如写电商爆款文案时总“跑题”，或生成技术文档时专业术语不够。本文将用“教小朋友学画画”的通俗类比，从微调的底层逻辑讲到实战技巧，带你掌握让GPT-4“更懂
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容 AI大模型应用工坊 AI大模型开发实战 AIGC chatgpt ai
AIGC内容生成实战：如何用ChatGPT+DALL·E打造高转化内容关键词：AIGC、ChatGPT、DALL·E、内容生成、高转化营销、多模态协同、提示词工程摘要：随着AIGC（人工智能生成内容）技术的爆发式发展，ChatGPT（文本生成）与DALL·E（图像生成）的组合已成为内容创作领域的“黄金搭档”。本文将深度解析二者的协同原理，结合实战案例演示从需求分析到内容落地的全流程，并揭示提升内容
数据分析领域中AI人工智能的发展前景展望 AI大模型应用工坊 AI大模型开发实战数据分析人工智能数据挖掘 ai
数据分析领域中AI人工智能的发展前景展望关键词：数据分析、人工智能、机器学习、深度学习、数据挖掘、预测分析、自动化摘要：本文深入探讨了人工智能在数据分析领域的发展现状和未来趋势。我们将从核心技术原理出发，分析AI如何改变传统数据分析范式，详细讲解机器学习算法在数据分析中的应用，并通过实际案例展示AI驱动的数据分析解决方案。文章还将探讨行业应用场景、工具生态以及未来发展面临的挑战和机遇，为数据分析师
AI人工智能中的数据挖掘：提升智能决策能力
AI人工智能中的数据挖掘：提升智能决策能力关键词：数据挖掘、人工智能、机器学习、智能决策、数据分析、特征工程、模型优化摘要：本文深入探讨了数据挖掘在人工智能领域中的核心作用，重点分析了如何通过数据挖掘技术提升智能决策能力。文章从基础概念出发，详细介绍了数据挖掘的关键算法、数学模型和实际应用场景，并通过Python代码示例展示了数据挖掘的全流程。最后，文章展望了数据挖掘技术的未来发展趋势和面临的挑战
【三桥君】MCP中台，究竟如何实现多模型、多渠道、多环境的统一管控？如何以MCP为核心设计AI应用架构？三桥君《三桥君 MCP落地方法论》《三桥君 AI大模型落地方法论》#《三桥君 AI产品方法论》人工智能 AI产品经理 MCP API 三桥君系统架构 llama
你好，我是✨三桥君✨本文介绍>>一、引言随着人工智能技术的快速发展，越来越多的企业开始引入大语言模型（LLM）以提升用户体验和运营效率。然而，如何高效、稳定地将这些AI能力落地到生产环境呢？传统的系统架构往往难以应对AI应用的高并发、低延迟和灵活扩展需求，因此，从整体架构角度设计AI应用架构显得尤为重要。本文三桥君将深入探讨以MCP为核心的AI应用架构，并分析多种部署方式的优劣势，为企业在AI落地
深入理解卷积神经网络（CNN）与循环神经网络（RNN） CodeJourney. cnn rnn 人工智能
在当今的人工智能领域，神经网络无疑是最为璀璨的明珠之一。而卷积神经网络（ConvolutionalNeuralNetworks，CNN）和循环神经网络（RecurrentNeuralNetworks，RNN）作为神经网络家族中的重要成员，各自有着独特的架构和强大的功能，广泛应用于众多领域。本文将深入探讨这两种神经网络的原理、特点以及应用场景，为对深度学习感兴趣的读者提供全面的知识讲解。一、卷积神经
今年校招竞争真激烈 12_05
程序员满大街，都要找不到工作了。即使人工智能满大街，我也后悔当初没学机器学习，后悔当初没学Java。C++真难找工作。难道毕了业就失业吗？好担心！
如何运用深度学习打造高效AI人工智能系统 AI智能探索者 AI Agent 智能体开发实战人工智能深度学习 ai
如何运用深度学习打造高效AI人工智能系统关键词：深度学习、AI系统、神经网络、模型优化、实战开发摘要：本文将从深度学习的核心概念出发，结合生活实例和代码实战，系统讲解如何构建高效AI系统。我们会拆解数据准备、模型设计、训练优化、部署落地的全流程，揭秘“数据-模型-训练-推理”的协同机制，并通过具体案例演示从0到1开发AI系统的关键技巧，帮助开发者掌握打造高效AI系统的底层逻辑。背景介绍目的和范围在
非欧空间计算加速：图神经网络与微分几何计算的GPU优化（流形数据的内存布局优化策略）九章云极AladdinEdu 空间计算神经网络人工智能 gpu算力算法 java 开发语言
一、非欧空间计算的革命性意义与核心挑战在三维形状分析、社交网络建模、分子动力学模拟等领域，非欧几里得空间数据（流形数据）的处理正推动人工智能技术向更复杂的几何结构迈进。传统欧式空间优化方法在处理流形数据时面临根本性局限：黎曼度量导致距离计算失效、局部坐标系动态变化引发内存访问模式混乱、曲率变化影响并行计算效率。本文提出基于分块流形存储（BlockedManifoldStorage,BMS）与层次化
ChatGPT还不能写小说吗？刘若愚
最近，ChatGPT大热，据说可以写论文，编故事，好像无所不能。于是，我给它出了个题目：写一篇5万字的科幻小说。人物：刘若愚，化学家；刘子琪，大律师；仔仔，刘子琪的宠物猫；周金凝，医生；刘泽余，大侦探；赵政淇，程序猿；杰夫（Jeff）机器人它给我的回答是：我很抱歉，我是一个AI语言模型，无法写出如此长篇的小说。但我可以为您提供一些写作灵感和指导：确定故事背景和时间线：在科幻小说中，背景和时间线非常
神奇的平静漫步的小马驹
我们七组色香味俱全的特色菜百家宴我们七组的仙女们仙女们在舞动上图是今晚上海nlp课堂的晚会照片。熟悉的场地，熟悉的伙伴们。只是，我从画面里，跑到了画面外。决定不去二阶的时候，我以为在这样的时刻，我会有很多情绪：郁闷、遗憾、羡慕、纠结……没想到，这一刻真的来临的时候，我心里是满满的喜悦、平静。其实，在读到惠安的时，我内心有些小波动：惠安和我工作类似，她也面临突击检查，她因为领导的理解、同事的护援而得
响应式编程实践：Spring Boot WebFlux构建高性能非阻塞服务 fanxbl957 Web spring boot 后端 java
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人响应式编程实践：SpringBootWebFlux构建高性能非阻塞服务一、引言在当今数字化时代，互
企业级RAG的数据方案选择 - 向量数据库、图数据库和知识图谱南七小僧 AI技术产品经理网站开发人工智能数据库知识图谱人工智能
如何为企业RAG选择合适的数据存储方式摘要:本文讨论了矢量数据库、图数据库和知识图谱在解决信息检索挑战方面的重要性，特别是针对企业规模的检索增强生成（RAG）。看看海外人工智能企业Writer是如何利用知识图谱增强企业级RAG。要点概要：矢量数据库高效存储数据，但缺乏上下文和关联信息。图数据库优先考虑数据点之间的关系，受益于关系结构。知识图谱在语义存储方面表现出色，由于其能够编码丰富的上下文信息，
【人工智能入门必看的最全Python编程实战（1）】 DFCED 人工智能 python 开发语言深度学习找工作就业
--------------------------------------------------------------------------------------------------------------------1.AIGC未来发展前景未完持续…1.1人工智能相关科研重要性拥有一篇人工智能科研论文及专利软著竞赛是保研考研留学深造以及找工作的关键门票！！！拥有一篇人工智能科研论文
2025毫米波雷达技术白皮书：智能汽车与物联网的感知核心
随着人工智能、物联网（IoT）和智能汽车产业的迅猛发展，毫米波雷达技术正成为感知领域的核心驱动力。毫米波雷达凭借其高精度、全天候和强抗干扰能力，广泛应用于智能汽车的自动驾驶、物联网的环境感知以及工业自动化。2025年，毫米波雷达技术在性能、应用场景和市场规模上都达到了一个全新的高度。本白皮书将深入探讨毫米波雷达技术的核心优势、发展趋势及其在智能汽车与物联网中的应用前景，同时推荐各大品牌的领先产品方
从零开始构建深度学习环境：基于Pytorch、CUDA与cuDNN的虚拟环境搭建与实践（适合初学者）荣华富贵8 程序员的知识储备2 程序员的知识储备3 深度学习 pytorch 人工智能
摘要：深度学习正在引领人工智能技术的革新，而对于初学者来说，正确搭建深度学习环境是迈向AI研究与应用的第一步。本文将为读者提供一套详尽的教程，指导如何在本地环境中搭建Pytorch、CUDA与cuDNN，以及如何利用Anaconda和PyCharm进行高效开发。内容涵盖从环境配置、常见错误修正，到基础的深度学习模型构建及训练。我们旨在为深度学习零基础的入门者提供一个全面且易于理解的“保姆级”教程，
人工智能概念之九：深度学习概述
文章目录相关文章一、深度学习的定位：AI时代的基石技术1.1技术生态全景图1.2技术革命的催化剂二、深度学习的双面性：性能优势与技术挑战2.1技术优势全景扫描2.2技术挑战深度剖析三、技术演进时间轴：70年的厚积薄发四、主流框架生态对比五、未来演进方向相关文章人工智能概念之二：人工智能核心概念：网页链接一、深度学习的定位：AI时代的基石技术1.1技术生态全景图深度学习处于人工智能（AI）技术金字塔
H800核心技术突破与行业应用实战智能计算研究中心其他
内容概要在人工智能技术持续迭代的背景下，H800芯片凭借自主架构优化与算力跃升，成为推动行业场景化落地的关键驱动力。本文将从技术路径、性能突破与行业应用三个维度，系统解析H800如何在高并发计算与低延时响应领域实现底层架构创新。首先聚焦其自主架构优化的核心技术路径，包括动态资源调度算法与异构计算单元的深度协同设计，揭示其在能效比与计算密度上的突破逻辑；进一步结合算力跃升的具体表现，探讨该芯片如何通
智慧建筑：科技引领房地产与建筑业的未来 RedPhoenix45
最新接入DeepSeek-V3模型，点击下载最新版本InsCodeAIIDE智慧建筑：科技引领房地产与建筑业的未来随着科技的飞速发展，人工智能（AI）和智能化工具正以前所未有的速度改变着各行各业。在房地产与建筑领域，这种变革尤为显著。从建筑设计到施工管理，再到物业管理，智能化技术正在重塑行业的每一个环节。本文将探讨如何利用先进的智能化工具提升房地产与建筑行业的效率，并介绍一款革命性的开发工具——它
智慧施工：AI技术赋能建筑安全监测新纪元
开发AI智能应用，就下载InsCodeAIIDE，一键接入DeepSeek-R1满血版大模型！智慧施工：AI技术赋能建筑安全监测新纪元在现代建筑行业中，施工安全始终是核心关注点之一。随着科技的飞速发展，人工智能（AI）和大数据分析逐渐成为提升施工安全的重要工具。本文将探讨如何利用智能化软件和大模型API来构建高效的施工安全监测系统，并介绍一款强大的开发工具——InsCodeAIIDE的应用场景及其
智慧工地系统：建筑行业数字化变革的引领者青云智慧园区 java
在建筑行业积极迈向数字化转型的浪潮中，智慧工地系统凭借“数据驱动、智能管控、协同增效”的核心优势，深度融合物联网、大数据、人工智能等前沿技术，构建起覆盖工程项目全生命周期的精细化管理体系。以下将从系统架构、核心功能模块、应用价值以及未来展望等方面，全方位剖析智慧工地系统如何实现施工全过程的智能化、高效化管理。一、系统架构：打造一体化协同管理平台智慧工地系统采用先进的分层架构设计，以底层的数据采集层
AGI和AIGC傻傻分不清楚，一篇文章告诉你如何分辨！
Look！我们的大模型商业化落地产品更多AI资讯请关注Free三天集训营助教在线为您火热答疑‍什么是AGI(人工通用智能)?AGI是ArtificialGeneralIntelligence的缩写，中文翻译为“通用人工智能”，该术语指的是机器能够完成人类能够完成的任何智力任务的能力。与狭义的人工智能(ANI)不同，狭义的人工智能是为特定领域或问题而设计的，而AGI旨在实现一般的认知能力，能够适应任
新一代数据库：融合多模智能，重塑数据价值
一、场景重塑产业格局：数据库“融合进化”AI浪潮奔涌而至，数字产业格局加速重构。云计算、移动互联、万物互联（IoT）、人工智能（AI）等技术的深度融合与快速落地，正以前所未有的速度重塑着企业的应用形态。新业务场景层出不穷——从高并发的在线交易、实时精准的分析决策，到海量物联网设备监控、基于图关系的风控反欺诈，再到AI驱动的智能推荐与内容生成，应用场景的多样性与复杂性已突破传统数据库的能力边界。这对
基于知识图谱技术增强大模型RAG知识库应用效果罗伯特之技术屋知识图谱人工智能
【摘要】本文是AI落地实践的优秀案例，利用RAG技术（Retrieval-AugmentedGeneration，检索增强生成）的知识库实践为背景，介绍了RAG技术的发展及存在的不足，以及知识图谱相关的知识，利用RAG技术去完善和智能化知识图谱。在AI技术大量涌现，但应用不足的情况下，指明了现有应用场景、技术与AI结合的具体做法。1.引言随着人工智能技术的加速演进，AI大模型如雨后春笋般纷纷涌现，
BGE-M3模型结合Milvus向量数据库强强联合实现混合检索
在基于生成式人工智能的应用开发中，通过关键词或语义匹配的方式对用户提问意图进行识别是一个很重要的步骤，因为识别的精准与否会影响后续大语言模型能否检索出合适的内容作为推理的上下文信息（或选择合适的工具）以给出用户最符合预期的回答。在本篇文章中，我将尽可能详细地介绍想达成准确识别用户提问意图的解决方案之一，即基于功能强大的BGE-M3模型和Milvus向量数据库实现混合检索（稠密向量densevect
朋友圈发的原力元宇宙项目到底能不能挣钱口碑信息传播者
原力元宇宙项目正如其名，是一场前所未有的数字化革命，融合了虚拟现实（VR）、人工智能（AI）、区块链（Blockchain）等前沿技术，开辟了全新的商业模式和赚钱机会。在朋友圈中频繁看到对该项目的推广宣传，确实反映了其在赚钱方面的潜力。本文将从多个角度解析原力元宇宙项目的盈利机制，揭示其中的商机所在。13分钟视频内容讲明白原力元宇宙创富项目，中国区运营服务对接微信：ForceZen激发兴趣的独特魅
html页面js获取参数值 0624chenhong html
1.js获取参数值js function GetQueryString(name) { var reg = new RegExp("(^|&)"+ name +"=([^&]*)(&|$)"); var r = windo
MongoDB 在多线程高并发下的问题 BigCat2013 mongodb DB 高并发重复数据
最近项目用到 MongoDB , 主要是一些读取数据及改状态位的操作. 因为是结合了最近流行的 Storm进行大数据的分析处理，并将分析结果插入Vertica数据库，所以在多线程高并发的情境下, 会发现 Vertica 数据库中有部分重复的数据. 这到底是什么原因导致的呢？笔者开始也是一筹莫展，重复去看 MongoDB 的 API , 终于有了新发现： com.mongodb.DB 这个类有
c++ 用类模版实现链表(c++语言程序设计第四版示例代码) CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T> class Node { private: Node<T> * next; public: T data;
最近情况麦田的设计者感慨考试生活
在五月黄梅天的岁月里，一年两次的软考又要开始了。到目前为止，我已经考了多达三次的软考，最后的结果就是通过了初级考试（程序员）。人啊，就是不满足，考了初级就希望考中级，于是，这学期我就报考了中级，明天就要考试。感觉机会不大，期待奇迹发生吧。这个学期忙于练车，写项目，反正最后是一团糟。后天还要考试科目二。这个星期真的是很艰难的一周，希望能快点度过。
linux系统中用pkill踢出在线登录用户被触发 linux
由于linux服务器允许多用户登录，公司很多人知道密码，工作造成一定的障碍所以需要有时踢出指定的用户 1/#who 查出当前有那些终端登录（用 w 命令更详细） # who root pts/0 2010-10-28 09:36 (192
仿QQ聊天第二版肆无忌惮_ qq
在第一版之上的改进内容: 第一版链接: http://479001499.iteye.com/admin/blogs/2100893 用map存起来号码对应的聊天窗口对象,解决私聊的时候所有消息发到一个窗口的问题. 增加ViewInfo类,这个是信息预览的窗口,如果是自己的信息,则可以进行编辑. 信息修改后上传至服务器再告诉所有用户,自己的窗口
java读取配置文件知了ing
1，java读取.properties配置文件 InputStream in; try { in = test.class.getClassLoader().getResourceAsStream("config/ipnetOracle.properties");//配置文件的路径 Properties p = new Properties()
__attribute__ 你知多少？矮蛋蛋 C++gcc
原文地址: http://www.cnblogs.com/astwish/p/3460618.html GNU C 的一大特色就是__attribute__ 机制。__attribute__ 可以设置函数属性（Function Attribute ）、变量属性（Variable Attribute ）和类型属性（Type Attribute ）。 __attribute__ 书写特征是：
jsoup使用笔记 alleni123 java 爬虫 JSoup
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.7.3</version> </dependency> 2014/08/28 今天遇到这种形式，
JAVA中的集合 Collectio 和Map的简单使用及方法百合不是茶 list map set
List ,set ,map的使用方法和区别 java容器类类库的用途是保存对象，并将其分为两个概念： Collection集合：一个独立的序列，这些序列都服从一条或多条规则;List必须按顺序保存元素，set不能重复元素；Queue按照排队规则来确定对象产生的顺序（通常与他们被插入的
杀LINUX的JOB进程 bijian1013 linux unix
今天发现数据库一个JOB一直在执行，都执行了好几个小时还在执行，所以想办法给删除掉系统环境： ORACLE 10G Linux操作系统操作步骤如下：第一步.查询出来那个job在运行，找个对应的SID字段 select * from dba_jobs_running--找到job对应的sid &n
Spring AOP详解 bijian1013 java spring AOP
最近项目中遇到了以下几点需求，仔细思考之后，觉得采用AOP来解决。一方面是为了以更加灵活的方式来解决问题，另一方面是借此机会深入学习Spring AOP相关的内容。例如，以下需求不用AOP肯定也能解决，至于是否牵强附会，仁者见仁智者见智。 1.对部分函数的调用进行日志记录，用于观察特定问题在运行过程中的函数调用
[Gson六]Gson类型适配器(TypeAdapter) bit1129 Adapter
TypeAdapter的使用动机 Gson在序列化和反序列化时，默认情况下，是按照POJO类的字段属性名和JSON串键进行一一映射匹配，然后把JSON串的键对应的值转换成POJO相同字段对应的值，反之亦然，在这个过程中有一个JSON串Key对应的Value和对象之间如何转换(序列化/反序列化)的问题。以Date为例，在序列化和反序列化时，Gson默认使用java.
【spark八十七】给定Driver Program，如何判断哪些代码在Driver运行，哪些代码在Worker上执行 bit1129 driver
Driver Program是用户编写的提交给Spark集群执行的application，它包含两部分作为驱动： Driver与Master、Worker协作完成application进程的启动、DAG划分、计算任务封装、计算任务分发到各个计算节点(Worker)、计算资源的分配等。计算逻辑本身，当计算任务在Worker执行时，执行计算逻辑完成application的计算任务
nginx 经验总结 ronin47 nginx 总结
　　　深感nginx的强大，只学了皮毛，把学下的记录。　　　获取Header 信息，一般是以$http_XX（ＸＸ是小写）获取body,通过接口，再展开，根据Ｋ取Ｖ　　　获取uri,以$arg_XX &n
轩辕互动-1.求三个整数中第二大的数2.整型数组的平衡点 bylijinnan 数组
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class ExoWeb { public static void main(String[] args) { ExoWeb ew=new ExoWeb(); System.out.pri
Netty源码学习-Java-NIO-Reactor bylijinnan java 多线程 netty
Netty里面采用了NIO-based Reactor Pattern 了解这个模式对学习Netty非常有帮助参考以下两篇文章： http://jeewanthad.blogspot.com/2013/02/reactor-pattern-explained-part-1.html http://gee.cs.oswego.edu/dl/cpjslides/nio.pdf
AOP通俗理解 cngolon spring AOP
1.我所知道的aop 初看aop,上来就是一大堆术语，而且还有个拉风的名字，面向切面编程，都说是OOP的一种有益补充等等。一下子让你不知所措，心想着：怪不得很多人都和我说aop多难多难。当我看进去以后，我才发现：它就是一些java基础上的朴实无华的应用，包括ioc，包括许许多多这样的名词，都是万变不离其宗而已。 2.为什么用aop&nb
cursor variable 实例 ctrain variable
create or replace procedure proc_test01 as type emp_row is record( empno emp.empno%type, ename emp.ename%type, job emp.job%type, mgr emp.mgr%type, hiberdate emp.hiredate%type, sal emp.sal%t
shell报bash: service: command not found解决方法 daizj linux shell service jps
今天在执行一个脚本时，本来是想在脚本中启动hdfs和hive等程序，可以在执行到service hive-server start等启动服务的命令时会报错，最终解决方法记录一下：脚本报错如下： ./olap_quick_intall.sh: line 57: service: command not found ./olap_quick_intall.sh: line 59
40个迹象表明你还是PHP菜鸟 dcj3sjt126com 设计模式 PHP 正则表达式 oop
你是PHP菜鸟，如果你：1. 不会利用如phpDoc 这样的工具来恰当地注释你的代码2. 对优秀的集成开发环境如Zend Studio 或Eclipse PDT 视而不见3. 从未用过任何形式的版本控制系统，如Subclipse4. 不采用某种编码与命名标准，以及通用约定，不能在项目开发周期里贯彻落实5. 不使用统一开发方式6. 不转换（或）也不验证某些输入或SQL查询串（译注：参考PHP相关函
Android逐帧动画的实现 dcj3sjt126com android
一、代码实现： private ImageView iv; private AnimationDrawable ad; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout
java远程调用linux的命令或者脚本 eksliang linux ganymed-ssh2
转载请出自出处： http://eksliang.iteye.com/blog/2105862 Java通过SSH2协议执行远程Shell脚本(ganymed-ssh2-build210.jar) 使用步骤如下： 1.导包官网下载: http://www.ganymed.ethz.ch/ssh2/ ma
adb端口被占用问题 gqdy365 adb
最近重新安装的电脑，配置了新环境，老是出现： adb server is out of date. killing... ADB server didn't ACK * failed to start daemon * 百度了一下，说是端口被占用，我开个eclipse，然后打开cmd，就提示这个，很烦人。一个比较彻底的解决办法就是修改
ASP.NET使用FileUpload上传文件 hvt .net C#hovertree asp.net webform
前台代码： <asp:FileUpload ID="fuKeleyi" runat="server" /> <asp:Button ID="BtnUp" runat="server" onclick="BtnUp_Click" Text="上传" />
代码之谜（四）- 浮点数（从惊讶到思考） justjavac 浮点数精度代码之谜 IEEE
在『代码之谜』系列的前几篇文章中，很多次出现了浮点数。浮点数在很多编程语言中被称为简单数据类型，其实，浮点数比起那些复杂数据类型（比如字符串）来说，一点都不简单。单单是说明 IEEE浮点数就可以写一本书了，我将用几篇博文来简单的说说我所理解的浮点数，算是抛砖引玉吧。一次面试记得多年前我招聘 Java 程序员时的一次关于浮点数、二分法、编码的面试，多年以后，他已经称为了一名很出色的
数据结构随记_1 lx.asymmetric 数据结构笔记
第一章 1.数据结构包括数据的逻辑结构、数据的物理/存储结构和数据的逻辑关系这三个方面的内容。 2.数据的存储结构可用四种基本的存储方法表示，它们分别是顺序存储、链式存储、索引存储和散列存储。 3.数据运算最常用的有五种，分别是查找/检索、排序、插入、删除、修改。 4.算法主要有以下五个特性：输入、输出、可行性、确定性和有穷性。 5.算法分析的
linux的会话和进程组网络接口 linux
会话：一个或多个进程组。起于用户登录，终止于用户退出。此期间所有进程都属于这个会话期。会话首进程：调用setsid创建会话的进程1.规定组长进程不能调用setsid，因为调用setsid后，调用进程会成为新的进程组的组长进程.如何保证？先调用fork，然后终止父进程，此时由于子进程的进程组ID为父进程的进程组ID，而子进程的ID是重新分配的，所以保证子进程不会是进程组长，从而子进程可以调用se
二维数组元素的连续求解 1140566087 二维数组 ACM
import java.util.HashMap; public class Title { public static void main(String[] args){ f(); } // 二位数组的应用 //12、二维数组中，哪一行或哪一列的连续存放的0的个数最多，是几个0。注意，是“连续”。 public static void f(){
也谈什么时候Java比C++快 windshome java C++
刚打开iteye就看到这个标题“Java什么时候比C++快”，觉得很好笑。你要比，就比同等水平的基础上的相比，笨蛋写得C代码和C++代码，去和高手写的Java代码比效率，有什么意义呢？我是写密码算法的，深刻知道算法C和C++实现和Java实现之间的效率差，甚至也比对过C代码和汇编代码的效率差，计算机是个死的东西，再怎么优化，Java也就是和C