腾讯云开发者

降本提效，贝壳搜索推荐架构统一之路

导语 | 搜索和推荐是用户获取信息的两种主要方式，在贝壳也是帮助客户找到房子的主要手段，那么二者都有哪些相似和不同之处？是否可以使用同一套架构来实现？统一架构之后又能带来哪些收益呢？本文是对贝壳搜索推荐部平台架构负责人——高攀在云+社区沙龙online的分享整理，希望与大家一同交流。

点击视频查看完整直播回放

一、贝壳搜索推荐使用场景

1. 人、房、客匹配连接

贝壳为大家提供了找房、买房的一整套服务。由于买房是一个非常重要且复杂的事情，它的流程很长，不可能像买书、买衣服一样，线上下单支付就完成了。买房的过程一般都会有一个线下的经纪人参与，就是我们俗称的“中介”。

所以贝壳的主要业务场景是人、房、客三者的连接匹配。人是指经纪人，房是房子，客就是我们的 C 端用户。

这三者的连接和匹配都是搜索的几个核心场景，比如“人客”的连接，我们有客源检索系统（经纪人找客户）和经纪人检索系统（客户找经纪人）。

而“人房”连接主要对应 B 端的房源搜索，就是提供给经纪人使用的房源搜索。比如当大家去线下的链家门店，告诉经纪人想要什么样的房子后，经纪人一般就会通过 B 端房源搜索系统帮你到合适的房子。

B 端搜索比 C 端搜索更复杂一些，是专门给有经验的经纪人使用的，是另一套搜索系统，包括新房、二手房、租房、链家直营、海外等各场景的B端房源检索，这些都属于“人房”连接。

“房客”匹配就是大家比较熟悉的 C 端的搜索推荐了。比如大家无论是上贝壳APP，还是PC站或者小程序，都会经常见到的二手房、新房、租房、海外、地图找房等各频道的搜索。以及各种首页推荐、相关推荐、猜你喜欢等推荐页面。

对我们来说，C 端目前是更核心的场景，因为 C 端的搜索推荐会直接影响到公司的线上商机转化率，需要我们持续不断的去优化搜索推荐的效果，提升点击率、转化率等，所以后面的介绍会主要围绕 C 端展开。

为了更好的支撑这些核心业务场景，作为搜索推荐平台而言，我们主要关注三个点：效率、成本和稳定性。效率包括“房客”匹配效率和研发迭代效率，成本包括人员成本和机器成本，稳定即是服务需要保证99.99%以上的高可用性。

2. 场景示例

下图就是大家可以在贝壳 APP 上看到的，搜索推荐的常见场景：贝壳 APP 首页中的主搜框、二手房、新房、租房、海外、必看好房、商业办公、查成交、找小区、地图找房等等。

随手进入一个频道，比如二手房频道，在上面输入自己想要的小区名、商圈名等等，就会返回给你想要的结果。

如果不进入搜索频道，在首页往下滑的话，会进入到推荐的首页。不需要任何关键词，直接给你推荐你可能感兴趣的小区、房子等等。

3. 场景概览

作为平台，除了核心业务，我们还赋能了很多其他场景，比如搜索平台当前一共赋能了 500 多个场景。

C端搜索包括上面提到的新二租等，目前承接了贝壳 60% 的线上商机。B 端的搜索包括房源搜索、客源搜索、装修搜索等等。除此之外，还支持了很多内部其他事业部需要用到搜索的业务，比如签中平台、交易平台、人事行政等等。

推荐方面，目前赋能了 300 多个场景，主要是在C端，同样包括二手房、新房、租赁等等，承接了 15% 的线上商机。场景主要有首页的推荐、相关推荐、猜你喜欢、feed 流等等。

和很多公司一样，在贝壳，搜索和推荐之前是分属于两个不同的团队各自发展的，整体代码架构差异都很大，所以我下面会先分别介绍两个平台各自的演进过程，然后再介绍搜索推荐架构统一的过程。

二、贝壳搜索平台架构演进

贝壳搜索平台主要经历了四个阶段：搜索服务、搜索平台、搜索云平台和搜索中台。

2017 年时还只是一个简单的搜索服务，主要用于链家二手房的搜索。随着公司业务的快速发展，很多其他业务线也都需要搜索能力。于是本着不重复造轮子的原则，我们把搜索服务进行平台化，开放它的能力，对各业务进行赋能，从而成为了搜索平台。

搜索平台到 2018 年的时候，已经接入了 100 多个业务，日均有 5 个亿的流量。

成为搜索平台之后，我们发现接入的业务越接越多，每接一个业务都需要占用一定的时间，造成大家大部分的时间都花在业务对接上，没有多少时间可以用于本身平台的技术迭代，长此以往，将很难有技术提升和沉淀，无论是对平台还是团队的同学，都是极为不利的。

所以我们在2019年的时候，把原来的搜索平台的整个业务对接部分，进行了流程化、线上化、产品化、自助化，进而升级为搜索云平台。

到2019 年时，整个搜索云平台接入了 300 多个业务，日均 10 亿流量。由于有了搜索云平台，业务方可以通过云平台在线上自助完成绝大部分的业务接入和上线工作，释放我们大部分搜索研发人力，所以我们可以将更多研发资源投入到搜索效果的优化和稳定性优化等方面。

于是在2020 年的时候，我们的搜索云平台进一步升级为搜索中台，到目前为止我们已经接入了500多个业务，日均20亿流量。可以看到我们整个系统的架构是随着业务的发展不断的去迭代进化的。

1. 第一阶段，简单的搜索服务

搜索服务最开始的架构非常简单，底层使用的是 SolrCloud，上层是两个服务：写入服务和查询服务。

写入服务提供全量更新数据和增量更新数据的功能，查询服务有简单的 Query 解析、召回服务和排序服务，上层是一个统一的 API 接口，提供写的接口和读的接口，还有配置变更的接口，是一个非常简单的搜索服务。

2. 平台阶段

升级为平台之后，我们为了降低业务接入的成本，快速对接业务数据，在数据流这块有一个大的改进。可以直接监听业务方的数据变更，通过MySQL binglog同步到搜索平台。底层的引擎也升级为了 ES 集群。

查询服务做了一个拆分，上层是带效果的查询服务，包括Query解析、召回、排序在内的SearchService，下层是一个基础的查询服务BasicSearch，直接和ES 集群对接，做一些基础的召回。

一些不需要特殊召回排序策略的业务可以直接查询BasicSearch。上层会有统一的网关，做流量收口，统一对所有的业务方的请求进行鉴权，然后分发到下层各个服务。

前面提到，成为搜索平台后接入的业务越来越多，导致RD 有大量的时间都花在业务接入上。

因为早期一个业务接入有很多步骤，比如需要先发邮件做需求沟通，然后再发邮件做需求的排期，RD 进行开发联调，然后发邮件说明联调通过，然后 QA 联调，发邮件QA联调测试通过，最后才能进行业务上线。

可以看到这整个流程非常繁琐，从最开始的提需求到最后的上线需要经过8个步骤，当业务多了之后，如果总是走这种线下人工对接的方式，效率是非常低下的。

3. 搜索云平台阶段

为了改变这个状况，我们开发了搜索云平台，搜索云平台的核心思路，是把整个业务对接的流程进行线上化、产品化、自助化。之前 RD 联调通过之后还需要手动修改 QA 测试环境的配置，QA 联调通过再去修改线上环境的配置。

这里会有两个问题，一是整体效率低下，另外由于大部分是人工配置上线，所以很容易出错，从而造成线上故障。

为了解决这个问题，我们搜索云平台的实现方案是，把配置统一放到 Mongo 中，联调通过后可以一键把 RD 环境的配置同步到 QA 环境。QA验证通过之后，再一键同步到线上环境，省去了中间人工修改测试环境配置和线上环境配置的整个过程，从而大大提高了效率。

其次是整个业务接入功能的平台化。上层我们开发了各个可视化模块，包括分词效果的可视化：可以直接看到不同分词器的分词效果，从而选择自己想要的分词器。数据流的可视化：可以看到数据流的同步情况，包括性能如何，还有多少数据未同步等等。接下来是 SLA 可视化、数据变更记录、配置变更记录等等。

下面是各模块耗时统计，包括业务 RD 耗时、业务 QA 耗时、搜索 RD 耗时、搜索 QA 耗时和长耗时主动干预。

整个搜索云平台就是为了提升业务接入的速度，通过耗时统计可以方便的看出耗时比较长的是哪个环节，从而针对性去优化该环节，就像慢查询优化一样。

平台管理方面第一步是打通数据流的依赖，然后是自助接入和自助运维：包括索引管理、集群管理、分词管理、服务复制等功能。

这些功能大大提高了RD的接入效率和运维效率，于是我们进一步再去提高QA的测试效率，开发了自助测试和自动审核上线等功能。

底层是监控报警平台，包括全链路追踪平台、监控平台、报警平台和值班管理。如下是我们整个搜索云平台的功能模块图。

举例来说，业务方通过平台填写需求然后申请接入，到搜索 RD 这边根据需求会填一些对应的配置，之后业务方可以自己进一步完善配置，比如数据源的地址，然后会自动同步到 ES 集群中。

业务方还可以通过平台创建自己的表结构，指定有哪些字段，哪些字段需要分词、哪些需要建索引等。通过配置监听数据源、回调地址、索引结构后，再进行数据检验，最后就可以配置生效，返回给业务对应的搜索接口，业务方就可以自己去联调了，联调通过开发环境、测试环境、线上环境同步配置后，整个流程就走完了。在顺利的情况下，一个业务从接入到上线最快可能半天就完成了。

最终通过云平台的上线，我们整体的业务接入效率提升了 3 倍，之前平均下来一个业务接入需要 9 天，现在只要 3 天就够了，搜索 RD 人效提升了 6 倍。之前是通过人工变更上限，现在是通过平台自动化同步，故障率也降低了 60%。

通过这些效率的提升，我们释放了大量的研发人力，这些人力就可以投入到效果优化和稳定性优化上，从而进一步升级为搜索中台。

4. 搜索中台

如下是搜索中台的架构图，上层的网关和之前的一样，负责统一的鉴权、分发、限流、熔断、降级。数据流会通过事件构造、数据构造等模块写入分布式搜索引擎。

查询层会通过中控模块进行各个服务的调用，进行 Query 的纠错、改写、分类和理解。然后调用召回，召回模块会根据召回策略或召回模型进行底层数据的召回。然后再调用排序模块，经过实时排序模型的精排后将最终结果返回给用户。

同时我们进一步完善了统一的服务治理平台：包括注册中心、配置中心、负载均衡、消息总线、熔断降级、链路追踪、监控报警和服务编排等模块，最终形成了我们的搜索中台。

三、贝壳推荐平台的架构演进

贝壳推荐平台的架构演进也经历了四个大的迭代，最早期就是简单的基于内容和规则的推荐引擎，后面进一步增加了用户画像和协同过滤进行个性化推荐，再通过实时计算和实时模型实现实时个性化推荐，最后为了提升业务接入和迭代效率，推荐平台做了一个大的升级重构，支持业务配置化接入，最终升级为智能推荐平台。

1. 基于内容的推荐

早期基于内容的推荐非常简单，底层通过对一些房源数据（二手房源、租赁房源等等）进行离线计算，使用Content-based推荐算法，直接离线算出相似房源、热门房源等，然后写入 Redis。

在线推荐服务再从 Redis 中查出离线计算好的可能感兴趣的房源，然后直接返回给用户进行推荐。

2. 实时个性化推荐

在内容推荐的基础上，我们引入房源特征、实时用户画像和实时用户行为记录，升级为实时个性化推荐。

个性化推荐底层新增经纪人作业数据、用户行为日志等数据，然后通过离线计算进行数据清洗和特征工程，生成房源特征和用户画像。

再通过协同过滤算法，进行协同过滤推荐，然后把这些数据批量更新到在线存储引擎，包括离线计算好的召回数据、特征池和过滤集等。

和之前的架构类似，各业务线都有独立的推荐服务，直接查询在线存储得到召回数据和特征数据等，然后根据策略计算后返回给用户。

业务系统会经过 AB 实验平台对流量进行分流，进行效果迭代实验。同时，业务系统和推荐服务都会将实时埋点日志回流到实时计算服务和离线数仓中。从而实时更新召回数据和特征实现实时个性化推荐。

3. 智能平台推荐

为了提升业务接入效率和效果迭代效率，实时个性化推荐进一步升级迭代，将在线推荐服务进行拆分重构，下层离线计算和实时计算基本不变。

重构的目的主要用于解决早期的“烟囱模式”，不再每个业务场景对应一个独立的推荐服务，而是用同一套推荐服务支撑上层的所有业务，新接业务直接复用上线，而非重新开发启动一个服务，从而极大的提升效率。

为了达成这个目的，我们对整个推荐服务做了拆分，进行逻辑分层，分为应用层、计算层、数据层和模型层。

应用层主要对外提供API接口，以及处理简单的业务规则和配置管理。计算层包含推荐的几个核心流程，如召回、融合、排序和过滤，会分别调用数据层和模型层。数据层统一对下层的在线存储系统进行基础的数据查询。模型层进行在线特征工程后会调用模型服务进行在线预测。计算层拿到数据层返回的结果后进行策略融合，然后调用模型层进行模型精排，最终返回给业务系统。

四、贝壳搜索推荐架构统一

我们回忆一下搜索平台和推荐平台的大体架构，可以发现他们有很多地方是相通或相似的。我们可以先对比一下搜索系统和推荐系统的相同点和不同点。

1. 搜索推荐对比

先看相同的地方，首先搜索推荐两个系统的目的都是为了解决信息过载的问题，并且从贝壳的业务场景来看目的也是相同的，都是为了提升线上的商机转化率，进行房客的匹配。

从流程来看，二者都包含了几个核心模块：召回融合、模型排序、业务重排和推荐理由。

数据上，特别是贝壳的搜索推荐，都会用到这几份核心的数据：房源详情、房源特征、用户画像、用户行为特征等等。算法模型也是可以复用的，比如我们现在使用的 WDL 和 DeepFM模型，都可以用于搜索推荐两种场景。

平台工具同样是可以复用的，搜索和推荐都会用到 AB 实验平台、机器学习平台、模型管理平台和效果分析平台等。

再看不同点，从行为上来看，搜索是非常主动的行为，推荐是被动的。从意图上来看，搜索的意图一般都很明确，而推荐只需要有模糊的偏好就可以。Query 是显而易见的，搜索大部分场景都会有 Query，但是推荐没有。

搜索对个性化要求是比较弱的，推荐是非常强的根据用户画像进行个性化推荐的需求。多样性同样搜索会比较弱，推荐会比较强。搜索是强相关的，推荐相关性不需要太强，会希望可以推出一些“惊喜”。

搜索的数据实时性要求是特别高的，数据要求秒级更新，比如一个房子已经卖出后就不能再被搜出来了。而推荐的数据很多都是天级更新的。还有一个不同点是已读过滤，推荐基本是读过的就不会再推荐了，但是搜索就不会，读过也会展现。

2. 为什么要做架构统一

上面相同和不同的对比也部分解释了我们为什么要做架构统一，这里我再具体说明一下。

第一个原因就是我们前面介绍的，他们是完全可以统一的，从整体的目的、功能、流程、架构上都是相通的、相似的。

第二个原因是我们统一的核心目的：降本提效，也即是本次分享的标题。

既然它的目的、流程、功能架构都是相通相似的，那我们用同一套架构、同一个套代码来完成肯定是可以提升我们整体效率的。我们的工程和算法人员都可以复用。代码、数据和特征模型也都可以复用，从而降低开发和维护成本。

之前由于是两套完全独立的系统，搜索团队有自己的工程研发和算法研发，推荐团队也有自己的工程和算法，各自维护自己的系统，这样肯定是会有很多重复工作在里面。统一之后，两边都需要用到的一些平台、工具也都可以复用了，避免重复造轮子。

以上三点通过架构统一都可以直接解决，后面两点是我们希望在统一的过程中优化的。比如常规策略的效果迭代可以支持界面配置上线，简化流程，降低上线成本。

其次需要把召回、排序、重排、理由各模块进行解耦，支持分层实验，可以专人专项，各司其职，比如有的人专门负责优化召回，有的人专门负责优化排序，进一步提升整体的研发效率。

所以整体而言，我们核心目的就是希望做到搜索推荐架构统一后，达成一个1+1大于2的效果，在各方面都降低成本，提升效率。

其次还有一些附带的好处，比如说提升整体的稳定性。因为搜索相对而言稳定性的要求会比推荐更高，并且整个搜索的流量比推荐大很多，所以之前搜索团队的服务治理更加完善一些，有整套的服务治理体系，推荐这边偏少一些，完成架构统一后，推荐可以直接复用之前搜索的整套服务治理体系。

另外还可以进一步的提升性能。之前贝壳推荐系统的召回是基于搜索的，推荐召回会直接调用搜索的网关，然后搜索服务再去调用底层引擎，比如说 ES 等等，所以会经过好几次的网络传输。

当我们把架构统一之后，就不需要区分搜索和推荐了，推荐的服务可以和搜索服务一样，直接查询底层 ES，减少网络调用，从而提升推荐系统的性能。

3. 架构统一方案

上图是搜索推荐架构统一之后的整体架构图。其实和之前的架构相似，但把搜索和推荐做了一个集成。上层还是各个业务线：二手房、新房、海外、租赁等等各业务线调用统一的网关，进行流量分发、鉴权、熔断、限流、降级等，然后调用底层各服务。

前面提到的搜索云平台统一进行各业务接入，以及整体的配置化管理和上线。然后会复用之前搜索整套服务治理体系：注册中心、配置中心等等。数据流会对业务方数据变更进行监听，实时同步数据到在线存储引擎中。

我们做的主要的大的重构是在查询层，对原搜索和推荐系统的各模块进行了统一的整合。

最新的查询层主要分为六个核心模块，请求一开始会通过中控模块做参数校验、策略调度、缓存和兜底，然后中控会去调用下层各模块，先是意图解析模块（搜索使用，推荐不需要），拿到意图解析的结果后再去调用召回模块，召回的时候会先获取一些用户画像和特征，然后进行多路召回和融合过滤，返回给中控。

中控得到召回的数据后调用排序，排序包括粗排和精排，接下来是重排，再之后调用理由模块，补充推荐理由，比如“满五唯一”，“近地铁”等等。拿到理由之后就会最终反馈给业务方，完成整个搜索推荐调用的过程。

中控负责各个模块的调度，比如推荐可以直接调用召回，然后排序、重排等。

同时在存储方面，我们增加了几个新的引擎能力，之前只有文本检索的 ES 引擎，后面增加了向量检索引擎和图检索引擎。

剩下的模块和之前推荐和搜索都是一样的，同样会实时回流业务方的埋点日志然后进行实时计算和离线计算。以上就是我们架构统一之后的搜索推荐新架构。

介绍一下几个比较核心的服务：

（1）中控服务

中控服务的设计原则是希望它尽量不要有业务逻辑，通过减少迭代最大化的保证中控服务的稳定性。

我们看到中控的核心是决定下层各个模块的调度，中控会对下游各个模块做降级，所以下游各个模块的异常都不会影响整体搜索和推荐的请求，但如果中控出了问题可能就会对线上的稳定性有影响，所以我们需要尽量保证中控服务的稳定性。

中控主要负责参数校验、调度、缓存、降级等功能。比如推荐不需要走 NLU 就可以直接跳过这个模块，还有一些场景不需要走重排或理由也都可以通过中控的配置直接跳过。

其次中控可以对一些对模块进行缓存，比如 NLU 和理由结果都可以缓存。

最后中控最大的作用就是降级，任何下游服务超时或异常都不会造成业务方的查询异常，各个模块都有默认超时时间设置，但同时会实时计算剩余时间，各模块的实际超时时间是该模块默认超时时间和剩余时间的最小值。

比如一个常规的调用链，开始调用意图解析，再调用召回，再反馈给业务方。假设我们调完重排要调用理由的时候，发现理由服务挂掉或者响应超时，中控则会跳过理由模块直接返回，相当于是降级返回。

如果召回模块超时，中控也会跳过召回模块，直接访问 ES 或 Redis，然后再拿这些结果去走后续的流程，相当于跳过整个召回逻辑直接拿基础引擎返回的召回数据传给排序走后面的流程。

最坏的情况下如果底层的存储引擎都挂掉的话，中控会直接去查 Redis 的缓存数据或者默认数据然后返回给用户。

下一个模块的超时时间是根据上一个调用超时的时间决定的，业务方一般设置的超时时间为 1 秒钟，但实际上我们的平响是 50ms 左右。

比如在异常情况下我们调重排的时候发现已经花了 950ms，由于只剩下50ms，所以再去调理由的时候，理由模块的超时时间会被实时设置为 50ms，而忽略其默认的超时时间。

（2）召回服务

召回服务包括请求的构造，拿到 NLU 结果后会对请求进行纠错和改写，然后获取用户画像、房源特征等，再执行多路召回、融合和过滤。

文本召回会去调 Elasticsearch，策略召回会去查 Redis，向量召回查 Milvus，商业召回会去调用业务方的接口，过滤召回是推荐特有的，比如一些已读过滤。在多路召回之后会做一个整体的融合过滤，然后返回给中控走下一个流程。

（3）重排服务

重排服务涉及到非常多的业务规则，每个业务线都不一样，有一些是可以复用的，有一些是不能复用的，比如强插、置顶、混排等等。

为了便利的组合复用这些规则逻辑，重排实现了workflow的工作流机制。例如默认配置中会有去重、融合、计算得分、按字段排序等默认规则，而“opt-in”可以增加规则，“opt-out”可以去除规则。

通过这个工作流机制，我们很多方法都可以复用，通过简单的配置决定走哪些规则，不走哪些规则，这样绝大多数场景都可以通过配置化的上线去满足。

其实当前我们的架构统一还在进行中，因为我们的服务比较多，但已经取得了一些阶段性成果，至少从人效上已经提了一倍。

原来搜索工程是六个人，推荐四个人，一共十个人，现在合并后只需要五个人。效果迭代效率上也有三倍的提升，之前一些策略规则调整，从开发到测试到上线平均需要十天，现在通过配置化上线基本三天就够了。

五、未来规划

未来规划主要有两点。

第一，沉淀通用策略模型组合，形成类似“策略套餐”，非核心业务可以自主选择，快速复用。

因为现在不管是算法还是工程，我们的资源都还是有限的，我们现在的业务量很大，接了成百上千个，不可能每一个业务都做优化。

我们希望可以通过沉淀一些通用的策略模型组合，把它打包成一个类似套餐的形式，一些非核心的业务就可以自主选择套餐复用配置好的模型和算法，进一步提升整体的优化效率。

第二，我们希望可以打造一个一站式的效果优化平台。

我们前面提到的很多系统，比如云平台、实验平台、模型管理平台等，目前都比较分散，并且有些平台工具是已经开发完善的，但有一些是还未开发完成的，比如样本管理、特征管理、实验管等。

我们后续会把各个平台和工具统一完善起来，同时全部打通，然后统一集成到一站式的效果优化平台中，包含业务管理、效果指标、机器学习、效果预测、流量实验、干预运营等各模块，从而进一步提升效果优化迭代的效率。

六、Q&A

Q：问下老师，云平台如何监控的，都监控了哪些指标？

A：我们云平台监控的指标非常多，比如数据流方面，包括各模块写入耗时、写入量、写入QPS、实时率、丢失率等。查询方面：整体查询耗时、各模块查询耗时、平均耗时、999分位耗时、9999分位耗时、查询QPS、整体流量的大小、整体流量稳定性、各状态码（200、400、499、5XX）数量、比率等等。还包括慢查询的监控，比如超过100ms的数量、超过500ms的数量、比率等等。

以上主要是性能和稳定性的监控，还有一些效果的监控指标，比如点击率、曝光率和商机转化率等等。这些监控有的是通过日志监控，有的是指标上报监控，使用了各种监控系统。

Q：自动编辑生成数据结构，会不会引起结构不合理的情况？怎么避免？

A：其实会有，这个我们遇到过，其实刚才可以看到我们云平台有一个数据接口自动校验，早前我们没有那个功能，经常遇到用户自己编辑、自己填写表结构，什么字段、什么类型。

因为他编辑可能出错，当我们拉数据的时候，会发现他的数据源 MySQL中的字段结构和他编辑的是不一样的，有时是多了一个字段，有时是少了，有时表结构里写的是字符串类型实际上是数字类型。经常会出现这样的问题，然后发现数据导不进去、同步不了，导致数据阻塞。

所以我们后来增加了数据接口的自动校验，他填完之后，系统会马上他的拉取少量数据，几百条、几千条做验证，拉出来的数据和表完全一致才能够进行下一步。

Q：老师，这个链路追踪是如何做的，是全链路吗？

A：我们现在是全链路追踪，基于ES 的 APM做的。大家如果了解的话就会知道，它可以自动的收集各个模块的耗时，最终放到一个 ES 日志集群中，然后可以界面分析各个环节的耗时、整体的耗时等等。

Q：问一下老师，如何实现推荐多路并行召回的？

A：多路并行召回主要通过线程池并行的发送多个请求或查询多个搜索引擎，比如向量引擎、文本引擎等，拿到多条召回流的结果后再跟进融合策略进行多路融合。

Q：网关是 openresty+lua 做？

A：网关我们用的是 Zuul，Spring Cloud 中的网关组件。

Q：老师，搜索和推荐质量保证方面，有没有什么好办法？

A：搜索推荐质量保证，这个指的是什么保证？稳定性刚才已经提到，如果是稳定性方面，我们确实做了很多，刚才提到，有整套的服务治理稳定性保障体系。其次我们的服务肯定是分布式多机部署的，单个服务挂掉了，对整体服务没有任何影响，同时做很完善的限流熔断降级机制。包括我们底层的存储引擎，也都是双机房互备部署的。

我们也搭建了完善的监控报警系统，比如499、5XX，超过千分之一就会短信或者电话报警。效果指标同样有监控报警，比如点击率转化率突然大幅度降低，也会及时报警，然后定位分析。

一方面是完善监控报警，另外，从一开始设计的时候，就要考虑这方面的问题，比如刚才说的中控降级，就是在设计的时候就充分考虑下层每一个服务挂掉的时候我们该怎么办？我们要做到的就是任何一个服务挂掉，都不会影响整体的查询。其次还会进行季度性的线上压测，及时发现一些线上隐患，摸清线上实际的吞吐量。

Q：老师，数据中台是必须的吗？这个如何取舍？

A：其实数据中台跟我们今天讲的关系不是很大，但既然同学问到，我个人觉得不是必须的，肯定看公司场景，如果小公司数据没有那么多，肯定不需要建数据中台，如果是大公司数据非常多，需要各部门打通的话，就可能需要做数据中台。

Q：底层服务器是自己构建还是使用公有云，人效提高以后，大家还要加班么？

A：现在贝壳是既有自建机房，又有腾讯云的机房。我们现在是双机房备份的。最坏的情况下，有一个机房挂了，对业务不会有太大影响，可以实时的切换到另一个机房去。

然后是否需要加班，加班这个东西跟人效关系不大，如果业务需求比较着急的话，一般还是需要加班的。如果不是很着急，大家按常规迭代，基本上加班不会太多。

人效提升之后，大家就可以去做更多的事情，探索更新的技术。比如我们整体人效提升之后，原来需要十个人做的事情，现在只需要五个人就够了，腾出来的五个人就可以做新技术方向的探索，比如说新的向量引擎的探索，新的图数据库引擎，包括新的模型算法的研究等等，实际上就是盘子更大，做的事情更多，当然产出也会更多。

Q：监控都是自己开发的吗有第三方厂商的产品吗？

A：都有吧，有一些开源的组件，也有自己研发的，还有一些公司其他平台提供的统一的监控系统。

Q：搜索平台和搜索中台最本质的区别是什么？

A：其实现在我们内部也不太说中台这个概念。如果一定要说区别的话，个人觉得就是中台相对平台更深入业务吧。做平台的时候，我们想的更多的是通用性，尽量少的在平台里做业务逻辑，不然的话就会觉得平台不够通用了。但做中台的时候，更多的是思考沉淀一些业务共性的问题解决方案。如果说只有一个业务有这种问题，可能让这个业务自己解决就行了，但如果像我们这样接了好几百个业务，很多业务都有某个相同或相似的问题，与其说每个业务分别去解决，倒不如由中台来思考一个统一的解决方案。

Q：可以内推吗？

A：我们现在也比较缺人，欢迎大家投递简历。邮箱：[email protected]

讲师简介

高攀

贝壳搜索推荐部平台架构负责人

整体负责贝壳搜索推荐系统的工程架构研发及平台化建设，支撑全公司所有搜索推荐相关业务。具备多年搜索、大数据等大规模分布式系统架构设计及研发经验。加入贝壳前负责百度Elasticsearch，从0到1搭建百度Elasticsearch平台，支撑百度PB级数据检索与分析，对ES源码进行多项优化改进，发布百度版本Elasticsearch。

文章推荐

腾讯云Elasticsearch集群规划及性能优化实践

你可能感兴趣的:(大数据,分布式,编程语言,hadoop,数据库)

三菱PLC全套学习资料及应用手册 good2know
本文还有配套的精品资源，点击获取简介：三菱PLC作为工业自动化领域的核心设备，其系列产品的学习和应用需要全面深入的知识。本次资料包为学习者提供从基础到进阶的全方位学习资源，包括各种型号PLC的操作手册、编程指南、软件操作教程以及实际案例分析，旨在帮助用户系统掌握PLC的编程语言、指令系统及在各类工业应用中的实施。1.三菱PLC基础知识入门1.1PLC的基本概念可编程逻辑控制器（PLC）是工业自动化
Git 与 GitHub 的对比与使用指南一念& 其它 git github
Git与GitHub的对比与使用指南在软件开发中，Git和GitHub是两个密切相关但本质不同的工具。下面我将逐步解释它们的定义、区别、核心概念以及如何协同使用，确保内容真实可靠，基于广泛的技术实践。1.什么是Git？Git是一个分布式版本控制系统，由LinusTorvalds于2005年创建。它的核心功能是跟踪代码文件的变化，帮助开发者管理项目历史记录、协作和回滚错误。Git是开源的，可以在本地
什么是缓存雪崩？缓存击穿？缓存穿透？分别如何解决？什么是缓存预热？ daixin8848 缓存 redis java 开发语言
缓存雪崩：在一个时间段内，有大量的key过期，或者Redis服务宕机，导致大量的请求到达数据库,带来巨大压力-给key设置不同的TTL、利用Redis集群提高服务的高可用性、添加多级缓存、添加降级流策略缓存击穿：给某一个key设置了过期时间，当key过期的时间，恰好这个时间点有大量的并发请求访问这个key，可能会瞬间把数据库压垮-互斥锁：缓存失败时，只允许一个请求去加载数据并更新缓存，其他请求阻塞
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
最新阿里四面面试真题46道：面试技巧+核心问题+面试心得风平浪静如码
前言做技术的有一种资历，叫做通过了阿里的面试。这些阿里Java相关问题，都是之前通过不断优秀人才的铺垫总结的，先自己弄懂了再去阿里面试，不然就是去丢脸，被虐。希望对大家帮助，祝面试成功，有个更好的职业规划。一，阿里常见技术面1、微信红包怎么实现。2、海量数据分析。3、测试职位问的线程安全和非线程安全。4、HTTP2.0、thrift。5、面试电话沟通可能先让自我介绍。6、分布式事务一致性。7、ni
【项目实战】容错机制与故障恢复：保障系统连续性的核心体系本本本添哥 004 -研效与DevOps运维工具链 002 -进阶开发能力分布式
在分布式系统中，硬件故障、网络波动、软件异常等问题难以避免。容错机制与故障恢复的核心目标是：通过主动检测故障、自动隔离风险、快速转移负载、重建数据一致性，最大限度减少故障对业务的影响，保障系统“持续可用”与“数据不丢失”。以下从核心机制、实现方式、典型案例等维度展开说明。一、故障检测：及时发现异常节点故障检测是容错的第一步，需通过多维度手段实时感知系统组件状态，确保故障被快速识别。1.健康检查与心
Redis + Caffeine 实现高效的两级缓存架构周童學 Java 缓存 redis 架构
Redis+Caffeine实现高效的两级缓存架构引言在现代高并发系统中，缓存是提升系统性能的关键组件之一。传统的单一缓存方案往往难以同时满足高性能和高可用性的需求。本文将介绍如何结合Redis和Caffeine构建一个高效的两级缓存系统，并通过三个版本的演进展示如何逐步优化代码结构。项目源代码：github地址、gitee地址两级缓存架构概述两级缓存通常由本地缓存（如Caffeine）和分布式缓
C++编程基础与面向对象概念解析侯昂面向对象编程 C++语法函数类与对象继承与多态性
C++编程基础与面向对象概念解析背景简介C++是一种广泛使用的面向对象编程语言，它允许开发者创建高效、灵活且功能强大的程序。本文基于《C++Primer》一书的章节内容，深入解析C++的核心概念和面向对象编程原则，旨在帮助读者构建扎实的C++编程基础。面向对象编程的原则软件危机与进化介绍了软件危机的产生和软件进化的必要性，强调了面向对象编程（OOP）在应对这些问题中的优势。面向对象编程范式讨论了面
Deepseek技术深化：驱动大数据时代颠覆性变革的未来引擎荣华富贵8 spring boot 搜索引擎后端缓存 redis
在大数据时代，信息爆炸和数据驱动的决策逐渐重塑各行各业。作为一项前沿技术，Deepseek正在引领新一轮技术革新，颠覆传统数据处理与分析方式。本文将从理论原理、应用场景和前沿代码实践三个层面，深入剖析Deepseek技术如何为大数据时代提供颠覆性变革的解决方案。一、技术背景与核心思想1.1大数据挑战与机遇在数据量呈指数级增长的背景下，传统数据处理方法面临数据存储、计算效率和信息提取精度的诸多挑战。
MySQL复习题
一.填空题1.关系数据库的标准语言是SQL。2.数据库发展的3个阶段中，数据独立性最高的是阶段数据库系统。3.概念模型中的3种基本联系分别是一对一、一对多和多对多。4.MySQL配置文件的文件名是my.ini或my.cnf。5.在MySQL配置文件中，datadir用于指定数据库文件的保存目录。6.添加IFNOTEXISTS可在创建的数据库已存在时防止程序报错。7.MySQL提供的SHOWCREA
大数据之路：阿里巴巴大数据实践——大数据领域建模综述
为什么需要数据建模核心痛点数据冗余：不同业务重复存储相同数据（如用户基础信息），导致存储成本激增。计算资源浪费：未经聚合的明细数据直接参与计算（如全表扫描），消耗大量CPU/内存资源。数据一致性缺失：同一指标在不同业务线的口径差异（如“活跃用户”定义不同），引发决策冲突。开发效率低下：每次分析需重新编写复杂逻辑，无法复用已有模型。数据建模核心价值性能提升：分层设计（ODS→DWD→DWS→ADS）
分布式链路追踪系统架构设计：从理论到企业级实践 ma451152002 java 分布式系统架构
分布式链路追踪系统架构设计：从理论到企业级实践本文深入探讨分布式链路追踪系统的架构设计原理、关键技术实现和企业级应用实践，为P7架构师提供完整的技术方案参考。目录引言：分布式链路追踪的重要性核心概念与技术原理系统架构设计数据模型与协议标准核心组件架构设计性能优化与扩展性设计企业级实施策略技术选型与对比分析监控与运维体系未来发展趋势P7架构师面试要点引言：分布式链路追踪的重要性微服务架构下的挑战在现
Android GreenDao介绍和Generator生成表对象代码
目录(?)[-]介绍创建工程转载请注明：http://blog.csdn.net/sinat_30276961/article/details/50052109最近无意中发现了GreenDao，然后查看了一些资料后，发现这个数据库框架很适合用，于是乎，查看了官网的api，并自己写了一个小应用总结一下它的使用方法。介绍按照国际惯例，在开篇，总要先介绍一下什么是GreenDao吧。首先需要说明的是Gr
Jupyter Notebook：数据科学的“瑞士军刀” a小胡哦机器学习基础人工智能机器学习
在数据科学的世界里，JupyterNotebook是一个不可或缺的工具，它就像是数据科学家手中的“瑞士军刀”，功能强大且灵活多变。今天，就让我们一起深入了解这个神奇的工具。一、JupyterNotebook是什么？JupyterNotebook是一个开源的Web应用程序，它允许你创建和共享包含实时代码、方程、可视化和解释性文本的文档。它支持多种编程语言，其中Python是最常用的语言之一。Jupy
大数据技术笔记—spring入门卿卿老祖
篇一spring介绍spring.io官网快速开始Aop面向切面编程，可以任何位置，并且可以细致到方法上连接框架与框架Spring就是IOCAOP思想有效的组织中间层对象一般都是切入service层spring组成前后端分离已学方式，前后台未分离：Spring的远程通信：明日更新创建第一个spring项目来源：科多大数据
Mac OSX 下的mysql数据库文件存放位置 Bruuuces mysql mac osx 位置存放
之前我的mysql的系统数据库里的表被我玩坏了，万般无奈之下只得删除所有mysql的东西重新构建数据库。按照网上搜到的内容删除后重装发现数据库没有什么变化。于是自己在每个可能存放数据库文件的目录查找，最终确认目录位置如下:使用HomeBrew安装为/usr/local/var/mysql使用官方下载的dmg镜像安装为/usr/local/mysql删除这个目录再重新安装mysql就会重新生成系统数
mac升级mysql_Mac OSX下的MySQL数据库升级 weixin_39801714 mac升级mysql
MacOSX下的数据库升级最麻烦的不过权限的问题.本文的MySQL的安装方式为OSX下DMG磁盘镜像的安装方式,MacPorts/Homebrew的方式大同小异.从5.6.17升级到5.7.18安装目录信息ls-al/usr/local|grepmysqllrwxr-xr-x1rootwheel30B52100:39mysql@->mysql-5.6.17-osx10.7-x86_64drwxr-
【MySQL】MySQL数据库如何改名武昌库里写JAVA 面试题汇总与解析 spring boot vue.js sql java 学习
MySQL建库授权语句https://www.jianshu.com/p/2237a9649ceeMySQL数据库改名的三种方法https://www.cnblogs.com/gomysql/p/3584881.htmlMySQL安全修改数据库名几种方法https://blog.csdn.net/haiross/article/details/51282417MySQL重命名数据库https://
HikariCP调试日志深度解析：生产环境故障排查完全指南
HikariCP调试日志深度解析：生产环境故障排查完全指南更新时间：2025年7月4日|作者：资深架构师|适用版本：HikariCP5.x+|难度等级：中高级前言在生产环境中，数据库连接池往往是系统性能的关键瓶颈。HikariCP作为当前最流行的Java连接池，其调试日志包含了丰富的运行时信息，能够帮助我们快速定位和解决各种连接池相关问题。本文将深入解析HikariCP的日志体系，提供一套完整的故
大学社团管理系统（11831） codercode2022 java spring boot spring echarts spring cloud sentinel java-rocketmq
有需要的同学，源代码和配套文档领取，加文章最下方的名片哦一、项目演示项目演示视频二、资料介绍完整源代码（前后端源代码+SQL脚本）配套文档（LW+PPT+开题报告）远程调试控屏包运行三、技术介绍Java语言SSM框架SpringBoot框架Vue框架JSP页面Mysql数据库IDEA/Eclipse开发四、项目截图有需要的同学，源代码和配套文档领取，加文章最下方的名片哦!
前端数据库：IndexedDB从基础到高级使用指南
文章目录前端数据库：IndexedDB从基础到高级使用指南引言一、IndexedDB概述1.1什么是IndexedDB1.2与其他存储方案的比较二、基础使用2.1打开/创建数据库2.2基本CRUD操作添加数据读取数据更新数据删除数据三、高级特性3.1复杂查询与游标3.2事务高级用法3.3性能优化技巧四、实战案例：构建离线优先的待办事项应用4.1数据库设计4.2同步策略实现五、常见问题与解决方案5.
Redis 分布式锁深度解析：过期时间与自动续期机制爱恨交织围巾分布式事务 redis 分布式数据库微服务学习 go
Redis分布式锁深度解析：过期时间与自动续期机制在分布式系统中，Redis分布式锁的可靠性很大程度上依赖于对锁生命周期的管理。上一篇文章我们探讨了分布式锁的基本原理，今天我们将聚焦于一个关键话题：如何通过合理设置过期时间和实现自动续期机制，来解决分布式锁中的死锁与锁提前释放问题。一、为什么过期时间是分布式锁的生命线？你的笔记中提到"服务挂掉时未删除锁可能导致死锁"，这正是过期时间要解决的核心问题
Gerapy爬虫管理框架深度解析：企业级分布式爬虫管控平台 Python×CATIA工业智造爬虫分布式 python pycharm
引言：爬虫工程化的必然选择随着企业数据采集需求指数级增长，传统单点爬虫管理模式面临三重困境：管理效率瓶颈：手动部署耗时占开发总时长的40%以上系统可靠性低：研究显示超过65%的爬虫故障源于部署或调度错误资源利用率差：平均爬虫服务器CPU利用率不足30%爬虫管理方案对比：┌───────────────┬─────────────┬───────────┬───────────┬──────────
pdf文件的属性值怎么修改？修改PDF内部的属性创建时间和修改时间这辈子谁会真的心疼你 pdf 修改PDF属性文件属性修改
部分PDF生成时会自动嵌入一些隐藏属性，比如创建软件版本、电脑用户名、修改记录等，这些信息可能涉及隐私或商业机密。例如，用个人电脑编辑的公司文件，属性中若包含个人用户名，可能泄露信息归属；通过修改或清除这些属性，可以避免不必要的信息暴露，降低隐私泄露风险。pdf文件的属性值怎么修改？要修改PDF文件的属性值（如标题、作者、主题等元数据），可以使用不同的工具或编程语言。以下是几种常见的方法：方法一：
修改gitlab默认的语言 Victor刘 gitlab
文章目录网上的方法1.采用数据库触发器的方法2.登录pg库2.1查看表2.2创建function2.3创建触发器2.4修改历史数据网上的方法网上修改/opt/gitlab/embedded/service/gitlab-rails/config/application.rb的方法，我试了，没生效，没进一步研究1.采用数据库触发器的方法2.登录pg库su-gitlab-psqlpsql-h/var/
如何在 Ubuntu 24.04 或 22.04 Linux 上安装和运行 Redis 服务器山岚的运维笔记 Linux 运维及使用 linux 服务器 ubuntu redis 数据库
Redis（RemoteDictionaryServer，远程字典服务器）是一种内存数据结构存储，通常用作NoSQL数据库、缓存和消息代理。它是开源的，因此用户可以免费安装，无需支付任何费用。Redis旨在为需要快速数据访问和低延迟的应用程序提供速度和效率。Redis支持多种数据类型，包括字符串（Strings）、列表（Lists）、集合（Sets）、哈希（Hashes）、有序集合（SortedS
数据库基础概念梳理 22:30Plane-Moon 数据库
1.数据存储类型表(Table):存储结构化数据的标准方式，数据以行和列的形式组织，具有固定的格式。非结构化数据(UnstructuredData):如音频、视频、图片、文本文档等，其格式不固定，不易直接用表存储。2.SQL的核心优势SQL尤其擅长处理和操作存储在表中的结构化数据。2.1数据类型约束(DataTypeConstraints):定义列可存储的数据种类。整数类型:TINYINT(1字节
2025最新系统 Git 教程（七）（完结）嘿rasa 2025最新教程系列 git
第4章分布式Git4.1分布式Git-分布式工作流程你现在拥有了一个远程Git版本库，能为所有开发者共享代码提供服务，在一个本地工作流程下，你也已经熟悉了基本Git命令。你现在可以学习如何利用Git提供的一些分布式工作流程了。这一章中，你将会学习如何作为贡献者或整合者，在一个分布式协作的环境中使用Git。你会学习为一个项目成功地贡献代码，并接触一些最佳实践方式，让你和项目的维护者能轻松地完成这个过
SQL笔记纯干货 AI入门修炼 oracle 数据库 sql
软件：DataGrip2023.2.3，phpstudy_pro,MySQL8.0.12目录1.DDL语句（数据定义语句）1.1数据库操作语言1.2数据表操作语言2.DML语句（数据操作语言）2.1增删改2.2题2.3备份表3.DQL语句（数据查询语言）3.1查询操作3.2题一3.3题二4.多表详解4.1一对多4.2多对多5.多表查询6.窗口函数7.拓展:upsert8.sql注入攻击演示9.拆表
大数据精准获客并实现高转化的核心思路和实现方法 2401_88470328 大数据精准获客数据分析数据挖掘大数据需求分析 big data
大数据精准获客并实现高转化的核心思路和实现方法大数据精准获客并实现高转化的核心思路和实现方法在当今信息爆炸的时代，企业如何通过海量的数据精准获取潜在客户，并提高转化率，已经成为营销策略中的关键环节。大数据精准获客的核心思路在于数据驱动、多渠道触达以及优化转化路径，从而实现高效的市场推广和客户转化。数据驱动原理和机制数据驱动的核心在于通过分析用户行为数据，挖掘潜在客户的需求和喜好，从而制定更加精准的
强大的销售团队背后竟然是大数据分析的身影蓝儿唯美数据分析
Mark Roberge是HubSpot的首席财务官，在招聘销售职位时使用了大量数据分析。但是科技并没有挤走直觉。大家都知道数理学家实际上已经渗透到了各行各业。这些热衷数据的人们通过处理数据理解商业流程的各个方面，以重组弱点，增强优势。 Mark Roberge是美国HubSpot公司的首席财务官，HubSpot公司在构架集客营销现象方面出过一份力——因此他也是一位数理学家。他使用数据分析
Haproxy+Keepalived高可用双机单活 bylijinnan 负载均衡 keepalived haproxy 高可用
我们的应用MyApp不支持集群，但要求双机单活（两台机器：master和slave）： 1.正常情况下，只有master启动MyApp并提供服务 2.当master发生故障时，slave自动启动本机的MyApp，同时虚拟IP漂移至slave，保持对外提供服务的IP和端口不变 F5据说也能满足上面的需求，但F5的通常用法都是双机双活，单活的话还没研究过服务器资源 10.7
eclipse编辑器中文乱码问题解决 0624chenhong eclipse乱码
使用Eclipse编辑文件经常出现中文乱码或者文件中有中文不能保存的问题，Eclipse提供了灵活的设置文件编码格式的选项，我们可以通过设置编码格式解决乱码问题。在Eclipse可以从几个层面设置编码格式：Workspace、Project、Content Type、File 本文以Eclipse 3.3（英文）为例加以说明： 1. 设置Workspace的编码格式： Windows-&g
基础篇--resources资源不懂事的小屁孩 android
最近一直在做java开发，偶尔敲点android代码，突然发现有些基础给忘记了，今天用半天时间温顾一下resources的资源。 String.xml 字符串资源涉及国际化问题 http://www.2cto.com/kf/201302/190394.html string-array
接上篇补上window平台自动上传证书文件的批处理问卷酷的飞上天空 window
@echo off : host=服务器证书域名或ip，需要和部署时服务器的域名或ip一致 ou=公司名称, o=公司名称 set host=localhost set ou=localhost set o=localhost set password=123456 set validity=3650 set salias=s
企业物联网大潮涌动：如何做好准备？蓝儿唯美企业
物联网的可能性也许是无限的。要找出架构师可以做好准备的领域然后利用日益连接的世界。尽管物联网（IoT）还很新，企业架构师现在也应该为一个连接更加紧密的未来做好计划，而不是跟上闸门被打开后的集成挑战。“问题不在于物联网正在进入哪些领域，而是哪些地方物联网没有在企业推进，” Gartner研究总监Mike Walker说。 Gartner预测到2020年物联网设备安装量将达260亿，这些设备在全
spring学习——数据库（mybatis持久化框架配置） a-john mybatis
Spring提供了一组数据访问框架，集成了多种数据访问技术。无论是JDBC，iBATIS(mybatis)还是Hibernate，Spring都能够帮助消除持久化代码中单调枯燥的数据访问逻辑。可以依赖Spring来处理底层的数据访问。 mybatis是一种Spring持久化框架，要使用mybatis，就要做好相应的配置： 1，配置数据源。有很多数据源可以选择，如：DBCP，JDBC，aliba
Java静态代理、动态代理实例 aijuans Java静态代理
采用Java代理模式，代理类通过调用委托类对象的方法，来提供特定的服务。委托类需要实现一个业务接口，代理类返回委托类的实例接口对象。按照代理类的创建时期，可以分为：静态代理和动态代理。所谓静态代理：　指程序员创建好代理类，编译时直接生成代理类的字节码文件。所谓动态代理：　在程序运行时，通过反射机制动态生成代理类。一、静态代理类实例： 1、Serivce.ja
Struts1与Struts2的12点区别 asia007 Struts1与Struts2
1) 在Action实现类方面的对比：Struts 1要求Action类继承一个抽象基类；Struts 1的一个具体问题是使用抽象类编程而不是接口。Struts 2 Action类可以实现一个Action接口，也可以实现其他接口，使可选和定制的服务成为可能。Struts 2提供一个ActionSupport基类去实现常用的接口。即使Action接口不是必须实现的，只有一个包含execute方法的P
初学者要多看看帮助文档不要用js来写Jquery的代码百合不是茶 jquery js
解析json数据的时候需要将解析的数据写到文本框中, 出现了用js来写Jquery代码的问题; 1, JQuery的赋值有问题代码如下: data.username 表示的是: 网易 $("#use
经理怎么和员工搞好关系和信任 bijian1013 团队项目管理管理
产品经理应该有坚实的专业基础，这里的基础包括产品方向和产品策略的把握，包括设计，也包括对技术的理解和见识，对运营和市场的敏感，以及良好的沟通和协作能力。换言之，既然是产品经理，整个产品的方方面面都应该能摸得出门道。这也不懂那也不懂，如何让人信服？如何让自己懂？就是不断学习，不仅仅从书本中，更从平时和各种角色的沟通
如何为rich:tree不同类型节点设置右键菜单 sunjing contextMenu tree Richfaces
组合使用target和targetSelector就可以啦，如下： <rich:tree id="ruleTree" value="#{treeAction.ruleTree}" var="node" nodeType="#{node.type}" selectionChangeListener=&qu
【Redis二】Redis2.8.17搭建主从复制环境 bit1129 redis
开始使用Redis2.8.17 Redis第一篇在Redis2.4.5上搭建主从复制环境，对它的主从复制的工作机制，真正的惊呆了。不知道Redis2.8.17的主从复制机制是怎样的，Redis到了2.4.5这个版本，主从复制还做成那样，Impossible is nothing! 本篇把主从复制环境再搭一遍看看效果，这次在Unbuntu上用官方支持的版本。 Ubuntu上安装Red
JSONObject转换JSON--将Date转换为指定格式白糖_ JSONObject
项目中，经常会用JSONObject插件将JavaBean或List<JavaBean>转换为JSON格式的字符串，而JavaBean的属性有时候会有java.util.Date这个类型的时间对象，这时JSONObject默认会将Date属性转换成这样的格式： {"nanos":0,"time":-27076233600000,
JavaScript语言精粹读书笔记 braveCS JavaScript
【经典用法】： //①定义新方法 Function .prototype.method=function(name, func){ this.prototype[name]=func; return this; } //②给Object增加一个create方法，这个方法创建一个使用原对
编程之美-找符合条件的整数用字符串来表示大整数避免溢出 bylijinnan 编程之美
import java.util.LinkedList; public class FindInteger { /** * 编程之美找符合条件的整数用字符串来表示大整数避免溢出 * 题目：任意给定一个正整数N，求一个最小的正整数M(M>1)，使得N*M的十进制表示形式里只含有1和0 * * 假设当前正在搜索由0，1组成的K位十进制数
读书笔记 chengxuyuancsdn 读书笔记
1、Struts访问资源 2、把静态参数传递给一个动作 3、<result>type属性 4、s:iterator、s:if c:forEach 5、StringBuilder和StringBuffer 6、spring配置拦截器 1、访问资源 (1)通过ServletActionContext对象和实现ServletContextAware,ServletReque
[通讯与电力]光网城市建设的一些问题 comsci 问题
信号防护的问题,前面已经说过了,这里要说光网交换机与市电保障的关系我们过去用的ADSL线路,因为是电话线,在小区和街道电力中断的情况下,只要在家里用笔记本电脑+蓄电池,连接ADSL,同样可以上网........
oracle 空间RESUMABLE daizj oracle 空间不足 RESUMABLE 错误挂起
空间RESUMABLE操作转 Oracle从9i开始引入这个功能，当出现空间不足等相关的错误时，Oracle可以不是马上返回错误信息，并回滚当前的操作，而是将操作挂起，直到挂起时间超过RESUMABLE TIMEOUT，或者空间不足的错误被解决。这一篇简单介绍空间RESUMABLE的例子。第一次碰到这个特性是在一次安装9i数据库的过程中，在利用D
重构第一次写的线程池 dieslrae 线程池 python
最近没有什么学习欲望,修改之前的线程池的计划一直搁置,这几天比较闲,还是做了一次重构,由之前的2个类拆分为现在的4个类. 1、首先是工作线程类:TaskThread,此类为一个工作线程,用于完成一个工作任务,提供等待(wait),继续(proceed),绑定任务(bindTask)等方法 #!/usr/bin/env python # -*- coding:utf8 -*-
C语言学习六指针 dcj3sjt126com c
初识指针，简单示例程序： /* 指针就是地址，地址就是指针地址就是内存单元的编号指针变量是存放地址的变量指针和指针变量是两个不同的概念但是要注意：通常我们叙述时会把指针变量简称为指针，实际它们含义并不一样 */ # include <stdio.h> int main(void) { int * p; // p是变量的名字， int *
yii2 beforeSave afterSave beforeDelete dcj3sjt126com delete
public function afterSave($insert, $changedAttributes) { parent::afterSave($insert, $changedAttributes); if($insert) { //这里是新增数据 } else { //这里是更新数据 } }
timertask shuizhaosi888 timertask
java.util.Timer timer = new java.util.Timer(true); // true 说明这个timer以daemon方式运行（优先级低， // 程序结束timer也自动结束），注意，javax.swing // 包中也有一个Timer类，如果import中用到swing包， // 要注意名字的冲突。 TimerTask task = new
Spring Security（13）——session管理 234390216 session Spring Security 攻击保护超时
session管理目录 1.1 检测session超时 1.2 concurrency-control 1.3 session 固定攻击保护
公司项目NODEJS实践0.3[ mongo / session ...] 逐行分析JS源代码 mongodb session nodejs
http://www.upopen.cn 一、前言书接上回，我们搭建了WEB服务端路由、模板等功能，完成了register 通过ajax与后端的通信，今天主要完成数据与mongodb的存取，实现注册 / 登录 /
pojo.vo.po.domain区别 LiaoJuncai java VO POJO javabean domain
　　POJO = "Plain Old Java Object"，是MartinFowler等发明的一个术语，用来表示普通的Java对象，不是JavaBean, EntityBean 或者 SessionBean。POJO不但当任何特殊的角色，也不实现任何特殊的Java框架的接口如，EJB， JDBC等等。　　　　即POJO是一个简单的普通的Java对象，它包含业务逻辑
Windows Error Code OhMyCC windows
0 操作成功完成. 1 功能错误. 2 系统找不到指定的文件. 3 系统找不到指定的路径. 4 系统无法打开文件. 5 拒绝访问. 6 句柄无效. 7 存储控制块被损坏. 8 存储空间不足, 无法处理此命令. 9 存储控制块地址无效. 10 环境错误. 11 试图加载格式错误的程序. 12 访问码无效. 13 数据无效. 14 存储器不足, 无法完成此操作. 15 系
在storm集群环境下发布Topology roadrunners 集群 storm topology spout bolt
storm的topology设计和开发就略过了。本章主要来说说如何在storm的集群环境中，通过storm的管理命令来发布和管理集群中的topology。 1、打包打包插件是使用maven提供的maven-shade-plugin，详细见maven-shade-plugin。 <plugin> <groupId>org.apache.maven.
为什么不允许代码里出现“魔数” tomcat_oracle java
　　在一个新项目中，我最先做的事情之一，就是建立使用诸如Checkstyle和Findbugs之类工具的准则。目的是制定一些代码规范，以及避免通过静态代码分析就能够检测到的bug。　　迟早会有人给出案例说这样太离谱了。其中的一个案例是Checkstyle的魔数检查。它会对任何没有定义常量就使用的数字字面量给出警告，除了-1、0、1和2。　　很多开发者在这个检查方面都有问题，这可以从结果
zoj 3511 Cake Robbery(线段树) 阿尔萨斯线段树
题目链接：zoj 3511 Cake Robbery 题目大意：就是有一个N边形的蛋糕，切M刀，从中挑选一块边数最多的，保证没有两条边重叠。解题思路：有多少个顶点即为有多少条边，所以直接按照切刀切掉点的个数排序，然后用线段树维护剩下的还有哪些点。 #include <cstdio> #include <cstring> #include <vector&