SakamataZ

Fate-Serving推理服务源码解读

https://fate-serving.readthedocs.io/en/develop/?query=guest
什么是Fate-Serving
fate-serving是FATE的在线部分，在使用FATE进行联邦建模完成之后，可以使用fate-serving进行包括单笔预测、多笔预测以及多host预测在内的在线联合预测。
模型的初始化流程
在FATE中建好模型之后，通过fate-flow的推送模型脚本可以将模型推送至serving-server。推送成功之后，serving-server会将该模型相关的预测接口注册进zookeeper，外部系统可以通过服务发现获取接口地址并调用。
参与方划分
fate在调用在线预测接口时，需要数据使用方（Guest）、数据提供方（Host）双方联合预测，Guest方对模型和特征数据进行业务处理后，Guest方接口参数中的sendToRemoteFeatureData会发往Host端，Host方则是通过自定义的Adaptor跟己方业务系统交互（eg：通过访问远程rpc接口、或者通过访问存储）来获取特征数据，并将获取的特征交给算法模块进行计算，最终得出合并后的预测结果并返回给Guest。

Fate和Secretflow推理服务的比较

Fate-serving适用jdk1.8+SSM，服务提供HTTP接口和RPC接口（grpc），代码量11w行；Secretflow-serving使用C++17+brpc，服务提供RPC接口，代码量1w行。
Secret-serving将模型的执行拆分成了Exector，实现了动态的调度执行，Fate不具备这样的能力。
Fate比隐语多的能力：

服务的故障恢复/重启能力，能够保留Server的版本记录并从备份中恢复；
服务注册、发现和鉴权
模型动态加载和卸载（热更新）[内存占用率更低]
弹性扩容，负载均衡，高可用

服务发现有两个维度，一个是类似serving里面的queryModel接口，另一个是借助curator实现的zk监听回调的能力。第二个能力没有暴露给用户，而只是在内部使用。

server-mode 推理执行模块

model是推理模块的核心，我们先看这部分。fate官网提供了推理算法的讲解，https://fate-serving.readthedocs.io/en/develop/algo/base/，所以这里只关注调度链路。
model模块的架构如下：

注意BaseComponent只实现了LocalInferenceAware。

PipelineModelProcessor初始化

model在server模块中被ModeLoader加载，ModeLoader会调用initModel进行模型的初始化。
每个模型对应一个PipelineModelProcessor。
serving-server在收到推送模型的请求后，会在内存中初始化一个PipelineModelProcessor实例。和隐语拆分成executor类似，PipelineModelProcessor也会将model拆分成components。但是，fate拆分的components并不是调度的最小单位，因此没有隐语那种动态执行能力。
fate的model同样适用proto定义，由dslParser进行parse后动态加载每一个components。**这里我们可以看到，通过反射，fate提供了动态模型加载能力。**对于线上服务，动态注册模型能力还是很重要的，可以实现服务的热更新。


public int initModel(Context context, Map<String, byte[]> modelProtoMap) {
    if (modelProtoMap != null) {
        logger.info("start init pipeline,model components {}", modelProtoMap.keySet());
        try {
            Map<String, byte[]> newModelProtoMap = changeModelProto(modelProtoMap);
            logger.info("after parse pipeline {}", newModelProtoMap.keySet());
            Preconditions.checkArgument(newModelProtoMap.get(PIPLELINE_IN_MODEL) != null);
            PipelineProto.Pipeline pipeLineProto = PipelineProto.Pipeline.parseFrom(newModelProtoMap.get(PIPLELINE_IN_MODEL));
            String dsl = pipeLineProto.getInferenceDsl().toStringUtf8();
            dslParser.parseDagFromDSL(dsl);
            ArrayList<String> components = dslParser.getAllComponent();
            HashMap<String, String> componentModuleMap = dslParser.getComponentModuleMap();
            // 调用每一个components的initModel
            for (int i = 0; i < components.size(); ++i) {
                String componentName = components.get(i);
                String className = componentModuleMap.get(componentName);
                logger.info("try to get class:{}", className);
                try {
                    // 动态加载components
                    Class modelClass = Class.forName(this.modelPackage + "." + className);
                    BaseComponent mlNode = (BaseComponent) modelClass.getConstructor().newInstance();
                    mlNode.setComponentName(componentName);
                    byte[] protoMeta = newModelProtoMap.get(componentName + ".Meta");
                    byte[] protoParam = newModelProtoMap.get(componentName + ".Param");
                    int returnCode = mlNode.initModel(protoMeta, protoParam);
                    if (returnCode == Integer.valueOf(StatusCode.SUCCESS)) {
                        componentMap.put(componentName, mlNode);
                        pipeLineNode.add(mlNode);
                        logger.info(" add class {} to pipeline task list", className);
                    } else {
                        throw new RuntimeException("init model error");
                    }
                } catch (Exception ex) {
                    pipeLineNode.add(null);
                    logger.warn("Can not instance {} class", className);
                }
            }
        } catch (Exception ex) {
            logger.info("initModel error:{}", ex);
            throw new RuntimeException("initModel error");
        }
        logger.info("Finish init Pipeline");
        return Integer.valueOf(StatusCode.SUCCESS);
    } else {
        logger.error("model content is null ");
        throw new RuntimeException("model content is null");
    }
}

guest推理

PipelineModelProcessor的guestInference同样在server中被调用，它的接口是：
public ReturnResult guestInference(Context context, InferenceRequest inferenceRequest, Map futureMap, long timeout)
这里的futureMap并不是特征，而是remote inference的结果。
guestInference首先进行singleLocalPredict，顺序调用components的LocalInferenceAware方法。
之后和remote inference的结果进行合并，顺序调用components的mergeRemoteInference方法。

模型服务

fate-serving-server的controller层定义了一些HTTP请求，grpc.service定义了rpc请求，因为controller也是构造rpc调用，所以不多介绍。

Service公共抽象类和Context

我们先看ModelService部分，ModelServiceProvider继承了AbstractServingServiceProvider，AbstractServingServiceProvider是一个抽象类，它继承了AbstractServiceAdaptor。
AbstractServiceAdaptor是所有Service和ServiceProvider的公共父抽象类，我们来看它提供了哪些接口和公用方法。

公共方法/变量：

getFlowCounterManage/setFlowCounterManagerr: 获取/设置flowCounterManager，flowCounterManager是模型的计数器，用来统计访问信息
getMethodMap/setMethodMap：获取设置一个string->method的映射
preChain/postChain：服务的前处理和后处理逻辑
AbstractStub：grpc的stub，每个Service和ServiceProvider都对应到一个grpc stub

需要实现的接口：

doService service的实际实现
transformExceptionInfo

接下来我们看service方法，service会传入一个服务上下文context，context实际上就是一个k-v，记载了执行中的一些信息。

    @Override
    public OutboundPackage<resp> service(Context context, InboundPackage<req> data) throws RuntimeException {

        OutboundPackage<resp> outboundPackage = new OutboundPackage<resp>();
        // 将requestInProcess + 1
        context.preProcess();
        List<Throwable> exceptions = Lists.newArrayList();
        context.setReturnCode(StatusCode.SUCCESS);
        // main方法退出时，会将此值设为0
        if (!isOpen) {
            return this.serviceFailInner(context, data, new ShowDownRejectException());
        }
        if(data.getBody()!=null) {
            context.putData(Dict.INPUT_DATA, data.getBody());
        }

        try {
            // 记录服务调用次数
            requestInHandle.addAndGet(1);
            resp result = null;
            context.setServiceName(this.serviceName);
            try {
                preChain.doPreProcess(context, data, outboundPackage);
                // 调用子类方法
                result = doService(context, data, outboundPackage);
                if (logger.isDebugEnabled()) {
                    logger.debug("do service, router info: {}, service name: {}, result: {}", JsonUtil.object2Json(data.getRouterInfo()), serviceName, result);
                }
            } catch (Throwable e) {
                exceptions.add(e);
                logger.error("do service fail, cause by: {}", e.getMessage());
            }
            outboundPackage.setData(result);
            postChain.doPostProcess(context, data, outboundPackage);

        }

模型服务代理类

ModelService主要用到了ModelServiceProvider这个Bean，它是模型服务的代理，我们来看这边的代码。
ModelServiceProvider使用了ModelManager，负责实际的模型管理，下一节会介绍ModelManager。
ModelServiceProvider提供了下面几个模型服务：

模型加载
模型在线发布
模型查询
模型卸载
模型解绑定
模型拉取
模型数据拉取

@FateService注解设置AbstractServiceAdaptor的preChain和postChain：

@FateService(name = "modelService", preChain = {
        "requestOverloadBreaker"
}, postChain = {
})

@FateService注解设置的chain在admin、service、proxy的Register中被调用：


/**
 * 当spring应用启动完成后，onApplicationEvent 方法会被调用
 **/
@Override
public void onApplicationEvent(ApplicationReadyEvent applicationEvent) {
    String[] beans = applicationContext.getBeanNamesForType(AbstractServiceAdaptor.class);
    FlowCounterManager flowCounterManager = applicationContext.getBean(FlowCounterManager.class);
    for (String beanName : beans) {
        AbstractServiceAdaptor serviceAdaptor = applicationContext.getBean(beanName, AbstractServiceAdaptor.class);
        serviceAdaptor.setFlowCounterManager(flowCounterManager);
        // 获取被FateService注解的bean
        FateService proxyService = serviceAdaptor.getClass().getAnnotation(FateService.class);
        Method[] methods = serviceAdaptor.getClass().getMethods();
        for (Method method : methods) {
            
            FateServiceMethod fateServiceMethod = method.getAnnotation(FateServiceMethod.class);
            if (fateServiceMethod != null) {
                String[] names = fateServiceMethod.name();
                for (String name : names) {
                    serviceAdaptor.getMethodMap().put(name, method);
                }
            }
        }
        if (proxyService != null) {
            serviceAdaptor.setServiceName(proxyService.name());
            String[] postChain = proxyService.postChain();
            String[] preChain = proxyService.preChain();
            for (String post : postChain) {
                Interceptor postInterceptor = applicationContext.getBean(post, Interceptor.class);
                serviceAdaptor.addPostProcessor(postInterceptor);
            }
            for (String pre : preChain) {
                Interceptor preInterceptor = applicationContext.getBean(pre, Interceptor.class);
                serviceAdaptor.addPreProcessor(preInterceptor);
            }

            this.serviceAdaptorMap.put(proxyService.name(), serviceAdaptor);
        }
    }

    logger.info("service register info {}", this.serviceAdaptorMap.keySet());
}

模型管理

ModelManager是非常重要的模块，负责模型服务的实际执行，我们分别看下上面提到的几个执行方法。

绑定

绑定的作用是给service id绑定一个已有的模型。
这里会维护一个serviceid -> key的映射（下图来自官网）：

模型池就是namespaceMap，存储一个模型名称到ModelProcessor的映射关系。
注意，每次操作都会进行本地缓存的更新，本地缓存用于服务恢复。

    public synchronized ReturnResult bind(Context context, ModelServiceProto.PublishRequest req) {
        if (logger.isDebugEnabled()) {
            logger.debug("try to bind model, receive request : {}", req);
        }
        ReturnResult returnResult = new ReturnResult();
        String serviceId = req.getServiceId();
        Preconditions.checkArgument(StringUtils.isNotBlank(serviceId), "param service id is blank");
        Preconditions.checkArgument(!StringUtils.containsAny(serviceId, URL_FILTER_CHARACTER), "Service id contains special characters, " + JsonUtil.object2Json(URL_FILTER_CHARACTER));

        returnResult.setRetcode(StatusCode.SUCCESS);
        Model model = this.buildModelForBind(context, req);
        String modelKey = this.getNameSpaceKey(model.getTableName(), model.getNamespace());
        Model loadedModel = this.namespaceMap.get(modelKey);
        if (loadedModel == null) {
            throw new ModelNullException("model " + modelKey + " is not exist ");
        }
        this.serviceIdNamespaceMap.put(serviceId, modelKey);
        if (zookeeperRegistry != null) {
            if (StringUtils.isNotEmpty(serviceId)) {
                zookeeperRegistry.addDynamicEnvironment(serviceId);
            }
            zookeeperRegistry.register(FateServer.guestServiceSets, Lists.newArrayList(serviceId));
        }
        //update cache
        this.store(serviceIdNamespaceMap, serviceIdFile);
        return returnResult;
    }
    private Model buildModelForBind(Context context, ModelServiceProto.PublishRequest req) {
        // 从请求的modelMap中读取mode info，
        // 可以发现，这里用的全都是从req读出来的数据
        Model model = new Model();
        String role = req.getLocal().getRole();
        model.setPartId(req.getLocal().getPartyId());
        model.setRole(Dict.GUEST.equals(role) ? Dict.GUEST : Dict.HOST);
        String serviceId = req.getServiceId();
        model.getServiceIds().add(serviceId);
        Map<String, ModelServiceProto.RoleModelInfo> modelMap = req.getModelMap();
        ModelServiceProto.RoleModelInfo roleModelInfo = modelMap.get(model.getRole());
        Map<String, ModelServiceProto.ModelInfo> modelInfoMap = roleModelInfo.getRoleModelInfoMap();
        Map<String, ModelServiceProto.Party> roleMap = req.getRoleMap();
        ModelServiceProto.Party selfParty = roleMap.get(model.getRole());
        String selfPartyId = selfParty.getPartyIdList().get(0);
        ModelServiceProto.ModelInfo selfModelInfo = modelInfoMap.get(selfPartyId);
        String selfNamespace = selfModelInfo.getNamespace();
        String selfTableName = selfModelInfo.getTableName();
        model.setNamespace(selfNamespace);
        model.setTableName(selfTableName);
        return model;
    }

加载

这里数据提供方（host）加载模型时，记录数据使用方(guest) name + namespace -> (host) model 映射关系，实现使用方和提供方模型的一一对应。
partnerModelMap在guest方始终为空。namespaceMap在host和guest方都存在，记录本地模型池映射关系。


    public synchronized ReturnResult load(Context context, ModelServiceProto.PublishRequest req) {
        if (logger.isDebugEnabled()) {
            logger.debug("try to load model, receive request : {}", req);
        }
        ReturnResult returnResult = new ReturnResult();
        returnResult.setRetcode(StatusCode.SUCCESS);
        Model model = this.buildModelForLoad(context, req);
        String namespaceKey = this.getNameSpaceKey(model.getTableName(), model.getNamespace());
        ModelLoader.ModelLoaderParam modelLoaderParam = new ModelLoader.ModelLoaderParam();
        String loadType = req.getLoadType();
        if (StringUtils.isNotEmpty(loadType)) {
            modelLoaderParam.setLoadModelType(ModelLoader.LoadModelType.valueOf(loadType));
        } else {
            modelLoaderParam.setLoadModelType(ModelLoader.LoadModelType.FATEFLOW);
        }
        modelLoaderParam.setTableName(model.getTableName());
        modelLoaderParam.setNameSpace(model.getNamespace());
        modelLoaderParam.setFilePath(req.getFilePath());
        ModelLoader modelLoader = this.modelLoaderFactory.getModelLoader(context, modelLoaderParam.getLoadModelType());
        Preconditions.checkArgument(modelLoader != null, "model loader not found");
        ModelProcessor modelProcessor = modelLoader.loadModel(context, modelLoaderParam);
        if (modelProcessor == null) {
            throw new ModelProcessorInitException("model initialization error, please check if the model exists and the configuration of the FATEFLOW load model process is correct.");
        }
        model.setModelProcessor(modelProcessor);
        modelProcessor.setModel(model);
        // 本地模型池映射关系
        this.namespaceMap.put(namespaceKey, model);
        // 数据提供方（host）加载模型时，记录数据使用方(guest) name + namespace -> (host) model 映射关系
        // 实现使用方和提供方模型的一一对应
        if (Dict.HOST.equals(model.getRole())) {
            model.getFederationModelMap().values().forEach(remoteModel -> {
                String remoteNamespaceKey = this.getNameSpaceKey(remoteModel.getTableName(), remoteModel.getNamespace());
                this.partnerModelMap.put(remoteNamespaceKey, model);
            });
        }
        /**
         *  host model
         */
        if (Dict.HOST.equals(model.getRole()) && zookeeperRegistry != null) {
            String modelKey = ModelUtil.genModelKey(model.getTableName(), model.getNamespace());
            zookeeperRegistry.addDynamicEnvironment(EncryptUtils.encrypt(modelKey, EncryptMethod.MD5));
            zookeeperRegistry.register(FateServer.hostServiceSets);
        }
        // update cache
        this.store(namespaceMap, namespaceFile);
        return returnResult;

    }

buildModelForLoad执行实际的模型动态加载：

private Model buildModelForLoad(Context context, ModelServiceProto.PublishRequest req) {
    Model model = new Model();
    String role = req.getLocal().getRole();
    model.setPartId(req.getLocal().getPartyId());
    model.setRole(Dict.GUEST.equals(role) ? Dict.GUEST : Dict.HOST);
    Map<String, ModelServiceProto.RoleModelInfo> modelMap = req.getModelMap();
    ModelServiceProto.RoleModelInfo roleModelInfo = modelMap.get(model.getRole());
    Map<String, ModelServiceProto.ModelInfo> modelInfoMap = roleModelInfo.getRoleModelInfoMap();
    Map<String, ModelServiceProto.Party> roleMap = req.getRoleMap();
    String remotePartyRole = model.getRole().equals(Dict.GUEST) ? Dict.HOST : Dict.GUEST;
    ModelServiceProto.Party remoteParty = roleMap.get(remotePartyRole);
    List<String> remotePartyIdList = remoteParty.getPartyIdList();
    for (String remotePartyId : remotePartyIdList) {
        ModelServiceProto.RoleModelInfo remoteRoleModelInfo = modelMap.get(remotePartyRole);
        ModelServiceProto.ModelInfo remoteModelInfo = remoteRoleModelInfo.getRoleModelInfoMap().get(remotePartyId);
        Model remoteModel = new Model();
        remoteModel.setPartId(remotePartyId);
        remoteModel.setNamespace(remoteModelInfo.getNamespace());
        remoteModel.setTableName(remoteModelInfo.getTableName());
        remoteModel.setRole(remotePartyRole);
        model.getFederationModelMap().put(remotePartyId, remoteModel);
    }
    ModelServiceProto.Party selfParty = roleMap.get(model.getRole());
    String selfPartyId = selfParty.getPartyIdList().get(0);
    ModelServiceProto.ModelInfo selfModelInfo = modelInfoMap.get(model.getPartId());
    Preconditions.checkArgument(selfModelInfo != null, "model info is invalid");
    String selfNamespace = selfModelInfo.getNamespace();
    String selfTableName = selfModelInfo.getTableName();
    model.setNamespace(selfNamespace);
    model.setTableName(selfTableName);
    // 从FATEFLOW中加载模型
    if (ModelLoader.LoadModelType.FATEFLOW.name().equals(req.getLoadType())) {
        try {
            ModelLoader.ModelLoaderParam modelLoaderParam = new ModelLoader.ModelLoaderParam();
            modelLoaderParam.setLoadModelType(ModelLoader.LoadModelType.FATEFLOW);
            modelLoaderParam.setTableName(model.getTableName());
            modelLoaderParam.setNameSpace(model.getNamespace());
            modelLoaderParam.setFilePath(req.getFilePath());
            ModelLoader modelLoader = this.modelLoaderFactory.getModelLoader(context, ModelLoader.LoadModelType.FATEFLOW);
            model.setResourceAdress(getAdressForUrl(modelLoader.getResource(context, modelLoaderParam)));
        } catch (Exception e) {
            logger.error("getloadModelUrl error = {}", e);
        }
    }
    return model;
}

故障恢复

服务注册、发现和鉴权

服务注册的时间

加载时

加载时只会在数据提供方进行服务注册：

       /**
         *  host model
         */
        if (Dict.HOST.equals(model.getRole()) && zookeeperRegistry != null) {
            String modelKey = ModelUtil.genModelKey(model.getTableName(), model.getNamespace());
            zookeeperRegistry.addDynamicEnvironment(EncryptUtils.encrypt(modelKey, EncryptMethod.MD5));
            zookeeperRegistry.register(FateServer.hostServiceSets);
        }

那么这里的DynamicEnvironment作用是什么呢？FateServer.hostServiceSets又是在什么时候被注册的呢？
首先我们看下FateServer.hostServiceSets的初始化，通过阅读源码我们可以发现，在ServingServer这个bean实现了InitializingBean，在初始化完成之后，会调用下面这一段代码，这段代码注册了Fate-Serving需要初始化的几个服务，后面我们可以看到，新的服务都是由这几个初始服务衍生的。

@Override
public void afterPropertiesSet() throws Exception {
    logger.info("try to star server ,meta info {}", MetaInfo.toMap());
    Executor executor = new ThreadPoolExecutor(MetaInfo.PROPERTY_SERVING_CORE_POOL_SIZE, MetaInfo.PROPERTY_SERVING_MAX_POOL_SIZE, MetaInfo.PROPERTY_SERVING_POOL_ALIVE_TIME, TimeUnit.MILLISECONDS,
            MetaInfo.PROPERTY_SERVING_POOL_QUEUE_SIZE == 0 ? new SynchronousQueue<Runnable>() :
                    (MetaInfo.PROPERTY_SERVING_POOL_QUEUE_SIZE < 0 ? new LinkedBlockingQueue<Runnable>()
                            : new LinkedBlockingQueue<Runnable>(MetaInfo.PROPERTY_SERVING_POOL_QUEUE_SIZE)), new NamedThreadFactory("ServingServer", true));
    FateServerBuilder serverBuilder = (FateServerBuilder) ServerBuilder.forPort(MetaInfo.PROPERTY_SERVER_PORT);
    serverBuilder.keepAliveTime(100, TimeUnit.MILLISECONDS);
    serverBuilder.executor(executor);
    serverBuilder.addService(ServerInterceptors.intercept(guestInferenceService, new ServiceExceptionHandler(), new ServiceOverloadProtectionHandle()), GuestInferenceService.class);
    serverBuilder.addService(ServerInterceptors.intercept(modelService, new ServiceExceptionHandler(), new ServiceOverloadProtectionHandle()), ModelService.class);
    serverBuilder.addService(ServerInterceptors.intercept(hostInferenceService, new ServiceExceptionHandler(), new ServiceOverloadProtectionHandle()), HostInferenceService.class);
    serverBuilder.addService(ServerInterceptors.intercept(commonService, new ServiceExceptionHandler(), new ServiceOverloadProtectionHandle()), CommonService.class);
    server = serverBuilder.build();
    server.start();
    boolean useRegister = MetaInfo.PROPERTY_USE_REGISTER;
    if (useRegister) {
        logger.info("serving-server is using register center");
        zookeeperRegistry.subProject(Dict.PROPERTY_PROXY_ADDRESS);
        zookeeperRegistry.subProject(Dict.PROPERTY_FLOW_ADDRESS);
        zookeeperRegistry.register(FateServer.serviceSets);
    } else {
        logger.warn("serving-server not use register center");
    }
    modelManager.restore(new BaseContext());
    logger.warn("serving-server start over");
}

接下来看第二个问题，DynamicEnvironment的作用，我们来看register这里的代码：

public synchronized void register(Set<RegisterService> sets) {
    if (logger.isDebugEnabled()) {
        logger.debug("prepare to register {}", sets);
    }
    String hostAddress = NetUtils.getLocalIp();
    Preconditions.checkArgument(port != 0);
    Preconditions.checkArgument(StringUtils.isNotEmpty(environment));

    Set<URL> registered = this.getRegistered();
    for (RegisterService service : sets) {
        try {
            URL url = generateUrl(hostAddress, service);
            URL serviceUrl = url.setProject(project);
            // 对于推理服务，useDynamicEnvironment为True
            if (service.useDynamicEnvironment()) {
                if (CollectionUtils.isNotEmpty(dynamicEnvironments)) {
                    dynamicEnvironments.forEach(environment -> {
                        URL newServiceUrl = service.protocol().equals(Dict.HTTP) ? url : serviceUrl.setEnvironment(environment);
                        // use cache service params
                        loadCacheParams(newServiceUrl);
                        // 对于每一个environment，生成一个新的service
                        // 生成的数量是environment的个数*sets的size
                        String serviceName = service.serviceName() + environment;
                        if (!registedString.contains(serviceName)) {
                            this.register(newServiceUrl);
                            this.registedString.add(serviceName);
                        } else {
                            logger.info("url {} is already registed, will not do anything ", newServiceUrl);
                        }
                    });
                }
            } else {
                if (!registedString.contains(service.serviceName() + environment)) {
                    URL newServiceUrl = service.protocol().equals(Dict.HTTP) ? url : serviceUrl.setEnvironment(environment);
                    if (logger.isDebugEnabled()) {
                        logger.debug("try to register url {}", newServiceUrl);
                    }
                    // use cache service params
                    loadCacheParams(newServiceUrl);

                    this.register(newServiceUrl);
                    this.registedString.add(service.serviceName() + environment);
                } else {
                    logger.info("url {} is already registed, will not do anything ", service.serviceName());
                }
            }
        } catch (Exception e) {
            e.printStackTrace();
            logger.error("try to register service {} failed", service);
        }
    }

    syncServiceCacheFile();

    if (logger.isDebugEnabled()) {
        logger.debug("registed urls {}", registered);
    }
}

可以看出来，这里通过environment的个数*sets的size的方式，减少了代码复杂度；只在数据提供方注册一次，防止重复注册。

绑定时

和上面加载的思路一样，只不过绑定只会被guest调用，所以不需要区分guest和host：

if (zookeeperRegistry != null) {
    if (StringUtils.isNotEmpty(serviceId)) {
        zookeeperRegistry.addDynamicEnvironment(serviceId);
    }
    // 给guestServiceSets中的每一个服务都注册一个新的serviceId服务
    zookeeperRegistry.register(FateServer.guestServiceSets, Lists.newArrayList(serviceId));
}

unload和unregister的代码逻辑差不多，因此就不展开了。

服务注册和服务发现

接下来我们看register模块，你会发现这里的代码特别多，因为路由、负载均衡等模块也在这里实现了。
本节主要关注注册逻辑，这样只需要看common和zookeeper两个文件夹就行了，接下来结合官网这张部署实例的图来讲。

首先，我们可以看到，fate-serving不实现zookeeper，zk集群需要客户自己部署。
这里用到的主要是ZookeeperRegistry这个类，我们就从这里展开。

zookeeper client的创建

public static ConcurrentMap registeryMap = new ConcurrentHashMap()是一个URL - > ZookeeperRegistry单例的map。
它的初始化流程如下：

public static synchronized ZookeeperRegistry getRegistry(String url, String project, String environment, int port) {
    if (url == null) {
        return null;
    }
    URL registryUrl = URL.valueOf(url);
    registryUrl = registryUrl.addParameter(Constants.ENVIRONMENT_KEY, environment);
    registryUrl = registryUrl.addParameter(Constants.SERVER_PORT, port);
    registryUrl = registryUrl.addParameter(Constants.PROJECT_KEY, project);
    List<URL> backups = registryUrl.getBackupUrls();
    if (registeryMap.get(registryUrl) == null) {
        URL finalRegistryUrl = registryUrl;
        registeryMap.computeIfAbsent(registryUrl, n -> {
            CuratorZookeeperTransporter curatorZookeeperTransporter = new CuratorZookeeperTransporter();
            ZookeeperRegistryFactory zookeeperRegistryFactory = new ZookeeperRegistryFactory();
            zookeeperRegistryFactory.setZookeeperTransporter(curatorZookeeperTransporter);
            ZookeeperRegistry zookeeperRegistry = (ZookeeperRegistry) zookeeperRegistryFactory.createRegistry(finalRegistryUrl);
            return zookeeperRegistry;
        });
    }
    return registeryMap.get(registryUrl);
}

我们先来看CuratorZookeeperTransporter，它负责维护一个Map zookeeperClientMap ，保留URL -> ZookeeperClient的关系。
我们看ZookeeperClient初始化的过程：

@Override
public ZookeeperClient connect(URL url) {
    ZookeeperClient zookeeperClient;
    // 解析所有url
    List<String> addressList = getURLBackupAddress(url);
    // The field define the zookeeper server , including protocol, host, port, username, password
    // 更新url->zookeeperClient映射
    if ((zookeeperClient = fetchAndUpdateZookeeperClientCache(addressList)) != null && zookeeperClient.isConnected()) {
        logger.info("find valid zookeeper client from the cache for address: " + url);
        return zookeeperClient;
    }
    // avoid creating too many connections， so add lock
    synchronized (zookeeperClientMap) {
        if ((zookeeperClient = fetchAndUpdateZookeeperClientCache(addressList)) != null && zookeeperClient.isConnected()) {
            logger.info("find valid zookeeper client from the cache for address: " + url);
            return zookeeperClient;
        }

        zookeeperClient = createZookeeperClient(toClientURL(url));
        logger.info("No valid zookeeper client found from cache, therefore create a new client for url. " + url);
        writeToClientMap(addressList, zookeeperClient);
        // 调度到下面的构造方法
    }
    return zookeeperClient;
}

public CuratorZookeeperClient(URL url) {
    super(url);
    try {
        // 从 URL 中获取连接超时设置，默认为 5000 毫秒
        int timeout = url.getParameter(TIMEOUT_KEY, 5000);

        // 使用 CuratorFrameworkFactory.Builder 构建 Curator 客户端
        CuratorFrameworkFactory.Builder builder = CuratorFrameworkFactory.builder()
                .connectString(url.getBackupAddress()) // 获取连接地址，这里使用了 getBackupAddress 方法
                .retryPolicy(new RetryNTimes(1, 1000)) // 设置重试策略，这里是重试一次，每次间隔 1000 毫秒
                .connectionTimeoutMs(timeout); // 设置连接超时时间

        aclEnable = MetaInfo.PROPERTY_ACL_ENABLE;
        if (aclEnable) {
            aclUsername = MetaInfo.PROPERTY_ACL_USERNAME;
            aclPassword = MetaInfo.PROPERTY_ACL_PASSWORD;

            // 如果启用 ACL，检查用户名和密码是否为空
            if (StringUtils.isBlank(aclUsername) || StringUtils.isBlank(aclPassword)) {
                aclEnable = false;
                MetaInfo.PROPERTY_ACL_ENABLE = false;
            } else {
                // 如果用户名和密码不为空，添加授权信息和 ACL 规则
                builder.authorization(SCHEME, (aclUsername + ":" + aclPassword).getBytes());

                Id allow = new Id(SCHEME, DigestAuthenticationProvider.generateDigest(aclUsername + ":" + aclPassword));
                // add more
                acls.add(new ACL(ZooDefs.Perms.ALL, allow));
            }
        }

        // 使用 builder 构建 Curator 客户端
        client = builder.build();

        // 添加连接状态监听器，处理连接状态变化事件
        client.getConnectionStateListenable().addListener(new ConnectionStateListener() {
            @Override
            public void stateChanged(CuratorFramework client, ConnectionState state) {
                // 处理连接状态变化事件，根据不同状态调用 stateChanged 方法
                // 只实现了RECONNECTED
                if (state == ConnectionState.LOST) {
                    CuratorZookeeperClient.this.stateChanged(StateListener.DISCONNECTED);
                } else if (state == ConnectionState.CONNECTED) {
                    CuratorZookeeperClient.this.stateChanged(StateListener.CONNECTED);
                } else if (state == ConnectionState.RECONNECTED) {
                    CuratorZookeeperClient.this.stateChanged(StateListener.RECONNECTED);
                }
            }
        });

        // 启动 Curator 客户端
        client.start();

        // 如果启用 ACL，为根节点设置 ACL
        if (aclEnable) {
            client.setACL().withACL(acls).forPath("/");
        }
    } catch (Exception e) {
        // 处理异常，抛出 IllegalStateException
        throw new IllegalStateException(e.getMessage(), e);
    }
}

ZookeeperRegistry 注册

继续看ZookeeperRegistry，在client初始化完后，ZookeeperRegistry会add一个状态监听器，用于断线重连之后服务的恢复。


public ZookeeperRegistry(URL url, ZookeeperTransporter zookeeperTransporter) {
    super(url);
    String group = url.getParameter(ROOT_KEY, Dict.DEFAULT_FATE_ROOT);
    if (!group.startsWith(PATH_SEPARATOR)) {
        group = PATH_SEPARATOR + group;
    }
    this.environment = url.getParameter(ENVIRONMENT_KEY, "online");
    project = url.getParameter(PROJECT_KEY);
    port = url.getParameter(SERVER_PORT) != null ? new Integer(url.getParameter(SERVER_PORT)) : 0;

    this.root = group;
    zkClient = zookeeperTransporter.connect(url);
    zkClient.addStateListener(state -> {
        if (state == StateListener.RECONNECTED) {
            logger.error("state listener reconnected");
            try {
                recover();
            } catch (Exception e) {
                logger.error(e.getMessage(), e);
            }
        }
    });
}
// recover最后会调用到：
public void addFailedRegisterComponentTask(URL url) {
    if(url!=null) {
        String instanceId = AbstractRegistry.INSTANCE_ID;

        FailedRegisterComponentTask oldOne = this.failedRegisterComponent.get(instanceId);
        if (oldOne != null) {
            return;
        }
        // 新的重试任务
        FailedRegisterComponentTask newTask = new FailedRegisterComponentTask(url, this);
        oldOne = failedRegisterComponent.putIfAbsent(instanceId, newTask);
        if (oldOne == null) {
            // never has a retry task. then start a new task for retry.
            // 设置超时时间，超时后调用doRegisterComponent()
            retryTimer.newTimeout(newTask, retryPeriod, TimeUnit.MILLISECONDS);
        }
    }
}

服务注册最后会调用到下面的client代码：

// 创建临时节点
@Override
public void createEphemeral(String path) {
    try {
        if (logger.isDebugEnabled()) {
            logger.debug("createEphemeral {}", path);
        }

        if (aclEnable) {
            // 如果启用 ACL，则使用指定的 ACL（acls）创建临时节点
            client.create().withMode(CreateMode.EPHEMERAL).withACL(acls).forPath(path);
        } else {
            // 如果未启用 ACL，则以默认权限创建临时节点
            client.create().withMode(CreateMode.EPHEMERAL).forPath(path);
        }
    } catch (NodeExistsException e) {
    } catch (Exception e) {
        throw new IllegalStateException(e.getMessage(), e);
    }
}
// 创建永久节点

@Override
protected void createPersistent(String path, String data) {
    byte[] dataBytes = data.getBytes(CHARSET);
    try {
        if (logger.isDebugEnabled()) {
            logger.debug("createPersistent {} data {}", path, data);
        }
        if (aclEnable) {
            client.create().withACL(acls).forPath(path, dataBytes);
        } else {
            client.create().forPath(path, dataBytes);
        }
    } catch (NodeExistsException e) {
        try {
            if (aclEnable) {
                Stat stat = client.checkExists().forPath(path);
                client.setData().withVersion(stat.getAversion()).forPath(path, dataBytes);
            } else {
                client.setData().forPath(path, dataBytes);
            }
        } catch (Exception e1) {
            throw new IllegalStateException(e.getMessage(), e1);
        }
    } catch (Exception e) {
        throw new IllegalStateException(e.getMessage(), e);
    }
}

ZookeeperRegistry 发现

subProject实现了服务发现，最终会调用到client.getChildren().usingWatcher(listener).forPath(path)：

@Override
public void subProject(String project) {
    if (logger.isDebugEnabled()) {
        logger.debug("try to subProject: {}", project);
    }
    super.subProject(project);
    failedSubProject.remove(project);
    try {
        doSubProject(project);
    } catch (Exception e) {
        addFailedSubscribedProjectTask(project);
    }
}
@Override
public void doSubProject(String project) {
    String path = root + Constants.PATH_SEPARATOR + project;
    // 监听 root + Constants.PATH_SEPARATOR + project
    List<String> environments = zkClient.addChildListener(path, (parent, childrens) -> {
        if (StringUtils.isNotEmpty(parent)) {
            logger.info("fire environments changes {}", childrens);
            // 监听新出现的children
            subEnvironments(path, project, childrens);
        }
    });

    if (logger.isDebugEnabled()) {
        logger.debug("environments {}", environments);
    }
    if (environments == null) {
        if (logger.isDebugEnabled()) {
            logger.debug("path {} is not exist in zk", path);
        }
        throw new RuntimeException("environment is null");
    }

    subEnvironments(path, project, environments);
}

private void subEnvironments(String path, String project, List<String> environments) {
    if (environments != null) {
        for (String environment : environments) {
            String tempPath = path + Constants.PATH_SEPARATOR + environment;
        	// 监听 root + Constants.PATH_SEPARATOR + project + onstants.PATH_SEPARATOR + environment
            List<String> services = zkClient.addChildListener(tempPath, (parent, childrens) -> {
                if (StringUtils.isNotEmpty(parent)) {
                    if (logger.isDebugEnabled()) {
                        logger.debug("fire services changes {}", childrens);
                    }
                    subServices(project, environment, childrens);
                }
            });

            subServices(project, environment, services);
        }
    }
}

如果父节点发生了变化，那么就会调用下面的方法，进行订阅：

private void subServices(String project, String environment, List<String> services) {
    if (services != null) {
        for (String service : services) {
            String subString = project + Constants.PATH_SEPARATOR + environment + Constants.PATH_SEPARATOR + service;
            if (logger.isDebugEnabled()) {
                logger.debug("subServices sub {}", subString);
            }
            subscribe(URL.valueOf(subString), urls -> {
                if (logger.isDebugEnabled()) {
                    logger.debug("change services urls =" + urls);
                }
            });
        }
    }
}

因为在fate-serving中使用的zk结构如下：
yml /FATE-SERVICES/{模块名}/{ID}/{接口名}/provider/{服务提供者信息}
从前面我们可以知道用户新的服务都是由固定的模块生成的，所以用户注册了新的服务之后，也能够被client发现。原始服务的注册在afterPropertiesSet()中进行，上面已经介绍过了。

HashedWheelTimer 定时任务

我们注意到ZookeeperRegistry的基类FailbackRegistry中出现了retryTimer，我们来看下它的实现。
在ZookeeperRegistry和FailbackRegistry中，任务失败后会设置：retryTimer.newTimeout(newTask, retryPeriod, TimeUnit.MILLISECONDS);
来启动一个定时重试任务，它会执行：

HashedWheelTimeout timeout = new HashedWheelTimeout(this, task, deadline);
timeouts.add(timeout);

�把任务加入队列中，worker会poll这个队列，到时间后执行任务。
HashedWheelTimer构造函数会执行worker的初始化逻辑，

workerThread = threadFactory.newThread(worker);

threadFactory是一个名称标记的线程池实现，给每个线程进行了命名。
我们继续看worker这边的run方法：

@Override
public void run() {
    // Initialize the startTime.
    startTime = System.nanoTime();
    if (startTime == 0) {
        // We use 0 as an indicator for the uninitialized value here, so make sure it's not 0 when initialized.
        startTime = 1;
    }

    // Notify the other threads waiting for the initialization at start().
    // HashedWheelTimer执行线程和worker线程之间同步
    // 等待worker初始化完成后才能添加任务
    startTimeInitialized.countDown();

    do {
        final long deadline = waitForNextTick();
        if (deadline > 0) {
            // 这里将相同tick的timeouts放到同一个bucket，就是所谓的HashedWheelBucket
            int idx = (int) (tick & mask);
            processCancelledTasks();
            HashedWheelBucket bucket =
                    wheel[idx];
            transferTimeoutsToBuckets();
            // 过期掉bucket中的所有timeouts
            bucket.expireTimeouts(deadline);
            tick++;
        }
    } while (WORKER_STATE_UPDATER.get(HashedWheelTimer.this) == WORKER_STATE_STARTED);

    // Fill the unprocessedTimeouts so we can return them from stop() method.
    for (HashedWheelBucket bucket : wheel) {
        bucket.clearTimeouts(unprocessedTimeouts);
    }
    for (; ; ) {
        // 处理所有的timeouts
        HashedWheelTimeout timeout = timeouts.poll();
        if (timeout == null) {
            break;
        }
        if (!timeout.isCancelled()) {
            unprocessedTimeouts.add(timeout);
        }
    }
    processCancelledTasks();
}

这里的逻辑就很简单，也没用小顶堆，因为这里的过期任务数量其实并不多。

路由和负载均衡

proxy模块用于路由服务的基类是BaseServingRouter，它有两个实现，一个是ConfigFileBasedServingRouter，另一个是ZkServingRouter。被用在如下地方：

HealthCheckEndPointService 用到了ConfigFileBasedServingRouter
DefaultServingRouter 用到了zkServingRouter，目前还没有实现

register模块用于路由服务的基类的RouterService，它的使用如下所示：

FederationRouterInterceptor 未实现（我没找到哪里用这个）
DefaultServingRouter 未实现
RegistedClient 路由到server
HealthCheckEndPointService 路由到fateflow
RouterService 路由到资源服务器
FateFlowModelLoader 路由到flow
DefaultFederatedRpcInvoker 未实现

我们看register这边的逻辑，负载均衡主要被路由模块使用，所以就一起看了。

register模块

我们可以看到，被AbstractRouterService使用的是LoadBalanceModel.random，RandomLoadBalance只有一个选择算法，按照这个算法，落在权重大的节点中的概率更高。

public class RandomLoadBalance extends AbstractLoadBalancer {

    public static final String NAME = "random";

    @Override
    protected List<URL> doSelect(List<URL> urls) {
        // 获取URL列表的长度
        int length = urls.size();

        // 初始化标志，表示所有URL的权重是否相同
        boolean sameWeight = true;

        // 初始化数组，用于存储每个URL的权重
        int[] weights = new int[length];

        // 获取第一个URL的权重，用于后续比较
        int firstWeight = getWeight(urls.get(0));
        weights[0] = firstWeight;

        // 初始化总权重，并加上第一个URL的权重
        int totalWeight = firstWeight;
        
        // 遍历剩余的URL，计算总权重，同时检查各个URL的权重是否相同
        for (int i = 1; i < length; i++) {
            int weight = getWeight(urls.get(i));

            weights[i] = weight;

            totalWeight += weight;
            
            // 如果有一个URL的权重不同于第一个URL，则标志位置为false
            if (sameWeight && weight != firstWeight) {
                sameWeight = false;
            }
        }

        // 如果总权重为正且不是所有URL的权重都相同，进行随机选择
        if (totalWeight > 0 && !sameWeight) {

            // 生成一个随机偏移量，范围在总权重内
            int offset = ThreadLocalRandom.current().nextInt(totalWeight);

            // 遍历URL列表，根据随机偏移量选择一个URL，使得该URL的权重占比与总权重相匹配
            for (int i = 0; i < length; i++) {
                offset -= weights[i];
                if (offset < 0) {
                    // 将选定的URL放入列表并返回
                    return Lists.newArrayList(urls.get(i));
                }
            }
        }

        // 特殊情况处理：如果总权重为非正数或所有URL的权重都相同，返回随机选择的URL
        return Lists.newArrayList(urls.get(ThreadLocalRandom.current().nextInt(length)));
    }
}

权重参数被存放在URL的private volatile transient Map numbers;中，我们可以看到这里没有修改的逻辑，所以最终都会使用默认值。

你可能感兴趣的:(推理引擎)

（二）SAP Group Reporting (GR) 核心子模块功能及数据流向架构解析
数据如何从子公司流转到合并报表的全过程，即数据采集→合并引擎→报表输出，特别是HANA内存计算如何优化传统ETL瓶颈。SAPGroupReporting(GR)核心模块功能及数据流向的架构解析，涵盖核心组件、数据处理流程和关键集成点，适用于S/4HANA1809+版本：一、核心功能模块概览模块功能关键事务码/FioriApp数据采集(DataCollection)整合子公司财务数据（SAP/非SA
实时数据流计算引擎Flink和Spark剖析程小舰 flink spark 数据库 kafka hadoop
在过去几年，业界的主流流计算引擎大多采用SparkStreaming，随着近两年Flink的快速发展，Flink的使用也越来越广泛。与此同时，Spark针对SparkStreaming的不足，也继而推出了新的流计算组件。本文旨在深入分析不同的流计算引擎的内在机制和功能特点，为流处理场景的选型提供参考。（DLab数据实验室w.x.公众号出品）一.SparkStreamingSparkStreamin
MotionLCM 部署优化踩坑解决bug AI算法网奇 aigc与数字人深度学习宝典文生motion
目录依赖项windowstorchok：渲染黑白图问题解决：humanml3d：sentence-t5-large下载数据：报错：Nomodulenamed'sentence_transformers'继续报错：fromtransformers.integrationsimportCodeCarbonCallback解决方法：推理相关转mesh：module‘matplotlib.cm‘hasno
Flowable 实战落地核心：选型决策与坑点破解练习时长两年半的程序员小胡 Flowable 流程引擎实战指南低代码 BPMN 流程引擎 flowable 后端 java
在企业级流程引擎的落地过程中，选型的准确性和坑点的预见性直接决定项目成败。本文聚焦Flowable实战中最关键的“选型决策”与“常见坑点”，结合真实项目经验，提供可落地的解决方案。一、流程引擎选型：从业务本质出发1.1选型的三大核心维度企业在选择流程引擎时，需避免陷入“技术崇拜”，应回归业务本质。评估Flowable是否适用，可从三个维度判断：业务复杂度若流程涉及动态审批链（如按金额自动升级审批）
Flowable 高级扩展：自定义元素与性能优化实战练习时长两年半的程序员小胡 Flowable 流程引擎实战指南流程图 flowable BPMN 流程引擎 java
在前五篇文章中，我们从基础概念、流程设计、API实战、SpringBoot集成，到外部系统协同，逐步构建了Flowable的应用体系。但企业级复杂场景中，原生功能往往难以满足定制化需求——比如需要特殊的审批规则网关、与决策引擎联动实现动态路由，或是在高并发场景下优化流程引擎性能。本文将聚焦Flowable的高级扩展能力，详解如何自定义流程元素、集成规则引擎，并掌握大型系统中的性能调优策略。一、自定
企业级区块链平台Hyperchain核心原理剖析 boyedu 区块链区块链企业级区块链平台 Hyperchain
Hyperchain作为国产自主可控的企业级联盟区块链平台，其核心原理围绕高性能共识、隐私保护、智能合约引擎及可扩展架构展开，通过多模块协同实现企业级区块链网络的高效部署与安全运行。以下从核心架构、关键技术、性能优化、安全机制、应用场景五个维度展开剖析：一、核心架构：分层解耦与模块化设计Hyperchain采用分层架构，将区块链功能解耦为独立模块，支持灵活组合与扩展：P2P网络层由验证节点（VP）
编程算法：技术创新的引擎与业务增长的核心驱动力
在数字经济时代，算法已成为推动技术创新与业务增长的隐形引擎。从存内计算突破冯·诺依曼瓶颈，到动态规划优化万亿级金融交易，编程算法正在重塑产业竞争格局。一、存内计算：突破冯·诺依曼瓶颈的算法革命1.1存内计算的基本原理传统计算架构中90%的能耗消耗在数据搬运上。存内计算（Processing-in-Memory）通过直接在存储单元执行计算，实现能效10-100倍提升：#传统计算vs存内计算能耗模型i
Deepseek技术深化：驱动大数据时代颠覆性变革的未来引擎荣华富贵8 spring boot 搜索引擎后端缓存 redis
在大数据时代，信息爆炸和数据驱动的决策逐渐重塑各行各业。作为一项前沿技术，Deepseek正在引领新一轮技术革新，颠覆传统数据处理与分析方式。本文将从理论原理、应用场景和前沿代码实践三个层面，深入剖析Deepseek技术如何为大数据时代提供颠覆性变革的解决方案。一、技术背景与核心思想1.1大数据挑战与机遇在数据量呈指数级增长的背景下，传统数据处理方法面临数据存储、计算效率和信息提取精度的诸多挑战。
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践 Liudef06小白特殊专栏人工智能 AIGC 架构人工智能 deepseek
基于DeepSeek的下一代大型游戏开发革命：架构、核心技术与项目管理实践DeepSeek大模型正重塑游戏开发范式，本文将深入解析如何利用这一革命性技术构建下一代大型游戏，涵盖从架构设计到项目管理的全流程实践。目录DeepSeek游戏引擎核心架构1.1神经符号系统融合架构1.2动态世界生成引擎智能NPC与剧情系统2.1角色人格建模技术2.2动态叙事生成算法大型项目管理体系3.1敏捷-AI混合开发流
用代码生成艺术字：设计个性化海报的秘密
本文围绕“用代码生成艺术字：设计个性化海报的秘密”展开，先概述代码生成艺术字在海报设计中的独特价值，接着介绍常用的代码工具（如HTML、CSS、JavaScript等），详细阐述从构思到实现的完整流程，包括字体样式设计、动态效果添加等，还分享了提升艺术字质感的技巧及实际案例。最后总结代码生成艺术字的优势，为设计师提供打造个性化海报的实用指南，助力提升海报设计的独特性与吸引力，符合搜索引擎SEO标准
Spark SQL架构及高级用法 Aurora_NeAr spark sql 架构
SparkSQL架构概述架构核心组件API层（用户接口）输入方式：SQL查询；DataFrame/DatasetAPI。统一性：所有接口最终转换为逻辑计划树（LogicalPlan），进入优化流程。编译器层（Catalyst优化器）核心引擎：基于规则的优化器（Rule-BasedOptimizer,RBO）与成本优化器（Cost-BasedOptimizer,CBO）。处理流程：阶段输入输出关键动
如何运用深度学习打造高效AI人工智能系统 AI智能探索者 AI Agent 智能体开发实战人工智能深度学习 ai
如何运用深度学习打造高效AI人工智能系统关键词：深度学习、AI系统、神经网络、模型优化、实战开发摘要：本文将从深度学习的核心概念出发，结合生活实例和代码实战，系统讲解如何构建高效AI系统。我们会拆解数据准备、模型设计、训练优化、部署落地的全流程，揭秘“数据-模型-训练-推理”的协同机制，并通过具体案例演示从0到1开发AI系统的关键技巧，帮助开发者掌握打造高效AI系统的底层逻辑。背景介绍目的和范围在
基于Python引擎的PP-OCR模型库推理张欣-男 python ocr 开发语言 PaddleOCR PaddlePaddle
基于Python引擎的PP-OCR模型库推理1.文本检测模型推理#下载超轻量中文检测模型：wgethttps://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tartarxfch_PP-OCRv3_det_infer.tarpython3tools/infer/predict_det.py--image_dir=".
推客小程序系统开发全流程解析：从0到1构建社交电商生态 wx_ywyy6798 小程序推客系统推客系统开发推客小程序推客小程序开发推客分销系统推客分销
一、推客小程序的市场背景与商业价值在当今移动互联网红利逐渐消退的背景下，社交电商正成为流量增长的新引擎。推客小程序作为一种轻量级的社交分销工具，完美融合了微信生态的社交属性与电商的变现能力，为企业提供了低成本获客的新渠道。推客模式的核心优势体现在三个方面：裂变式传播：基于微信社交关系链的分享机制，能够实现几何级数的用户增长低成本转化：推客作为"消费商"角色，大幅降低企业的客户获取成本精准营销：社交
搜索引擎技术选型 dusty_giser
近期，业主对POI检索提出了一些想法，针对之前简单的WordSegment分词和模糊匹配搜索需要进行一些更为符合业主需求的调整。于是这几天对搜索引擎进行了一些技术选型；一、ApacheLucene Lucene是一个开源的高性能、可扩展的全文检索引擎工具包，但不是一个完整的全文检索引擎，而是一个全文检索引擎的架构，提供了完整的查询引擎和索引引擎。所以它是一套信息检索工具包，可以说是当今最先进
Vue CSR 到 Nuxt 3 SSR 迁移：技术实现与问题解决实录二倍速播放前端 vue.js
1.迁移动机与技术选型1.1CSR架构的局限性基于Vue3和Vite构建的客户端渲染(CSR)单页应用(SPA)提供了良好的开发体验和用户交互流畅性。但是其核心局限在于：搜索引擎优化(SEO)：初始HTML响应仅包含一个根div元素，实际内容由JavaScript在浏览器端动态生成。虽然主流搜索引擎（如Google）能够执行部分JavaScript，但其抓取效率和稳定性不如直接获取完整HTML。非
模型压缩中的四大核心技术 —— 量化、剪枝、知识蒸馏和二值化由数入道人工智能剪枝人工智能算法模型压缩量化知识蒸馏二值化
一、量化(Quantization)量化的目标在于将原始以32位浮点数表示的模型参数和中间激活，转换为低精度（如FP16、INT8、甚至更低位宽）的数值表示，从而在减少模型存储占用和内存带宽的同时，加速推理运算，特别适用于移动、嵌入式和边缘计算场景。1.1概念与目标基本思想将高精度数值离散化为低精度表示。例如，将FP32权重转换为INT8，可降低内存需求约4倍，同时在支持低精度运算的硬件上加速计算
TiDB - 分布式数据库的架构与特性爽新全效瓷兔膏
本文还有配套的精品资源，点击获取简介：TiDB是一个开源的分布式NewSQL数据库，受到了Google的Spanner/F1系统的启发。它提供水平扩展和强一致性事务，适用于需要高可用性和大规模数据处理的场景。TiDB的核心特点包括其分布式架构，由TiDBServer（SQL层）、PDServer（调度器）和TiKVServer（存储引擎）组成；支持无缝的水平扩展和ACID事务；与MySQL高度兼容
Hive详解
一：Hive的历史价值1，Hive是Hadoop上的KillerApplication，Hive是Hadoop上的数据仓库，Hive同时兼具有数据仓库中的存储引擎和查询引擎的作用；而SparkSQL是一个更加出色和高级的查询引擎，所以在现在企业级应用中SparkSQL+Hive成为了业界使用大数据最为高效和流行的趋势。2，Hive是Facebook的推出，主要是为了让不动Java代码编程的人员也能
MySQL新增字段DDL：锁表全解析、避坑指南与实战案例
核心思考问题：新增字段一定会锁表吗？答案：不一定！这主要取决于：MySQL版本：这是最关键的因素。ALGORITHM选项：显式或隐式指定的算法。新增字段的属性：是否允许NULL？是否有默认值？默认值类型？字段位置？表的大小和存储引擎：InnoDB的行为与MyISAM不同（本文主要讨论InnoDB）。并发负载：操作期间对表的读写压力。一、真实案例场景：血泪教训场景1：电商大促前夜，核心订单表加字段（
三国萌将风檐展书读_d1b0
全新三国，全新演绎！游戏采用新一代Unity3d引擎、实时打击计算等众多技术，通过最轻松的操作即可体验到策略战斗、双技能战斗、多角色养成和搞笑幽默的三国故事等内容。清新呆萌画风，爆笑穿越剧情，让你尽可任性耍酷扮傻，活力四射。萌趣的风格，反转的故事，为玩家全新打造专属于你的爆笑三国。
小程序领域的盈利模式全解析 AI 小程序开发2020 小程序开发项目实战小程序开发宝典小程序 notepad++ai
小程序领域的盈利模式全解析：从"小工具"到"现金牛"的变现密码关键词：小程序盈利模式、广告变现、电商闭环、会员体系、私域流量、跨平台变现、商业生态摘要：本文以"如何让小程序从功能工具进化为盈利引擎"为主线，系统解析当前主流的7大盈利模式。通过生活场景类比、真实案例拆解和行业数据支撑，帮助开发者和企业理解不同模式的适用场景、落地路径与优化策略，最终找到适合自身业务的"变现组合拳"。背景介绍目的和范围
BGE-M3模型结合Milvus向量数据库强强联合实现混合检索
在基于生成式人工智能的应用开发中，通过关键词或语义匹配的方式对用户提问意图进行识别是一个很重要的步骤，因为识别的精准与否会影响后续大语言模型能否检索出合适的内容作为推理的上下文信息（或选择合适的工具）以给出用户最符合预期的回答。在本篇文章中，我将尽可能详细地介绍想达成准确识别用户提问意图的解决方案之一，即基于功能强大的BGE-M3模型和Milvus向量数据库实现混合检索（稠密向量densevect
AI Agent开发第60课-巧用QWEN3.0 0.6B：小身板扛大旗，AI界的轻骑兵 TGITCIC AI Agent开发大全 qwen3 qwen ali qwen 国产大模型小模型开源小模型 ai agent
第一章：小模型的生存法则——为什么0.6B参数就够了？1.1参数量的"黄金分割点"模型类型参数量推理延迟（ms）并发量（QPS）Qwen-0.6B6亿15-3010万+Qwen-1.5B15亿50-805万Qwen-7B70亿200+1万数据对比显示，当参数量超过6亿后，性能提升与成本增长呈现"抛物线"关系。就像智能手机从4G到5G的迭代，用户感知不到的速度提升，却要为硬件升级买单。Qwen-0.
手把手教你搭建AI搜图系统：基于BGE-VL+Milvus的完整实现指南
引言图像搜索有何价值？•帮你找身份证：在海量相册里搜索身份证•电商神器：淘宝"拍立淘"让你拍照变订单•设计师救星：3秒找到可商用的高清素材图老搜索vs新搜索的区别老搜索：像查字典，必须输入正确关键词新搜索：像跟人聊天，图片/语音都能搜，还能理解表情包为什么选BGE-VL+Milvus这个王炸组合？•就像给搜索引擎装了"人脑"（BGE-VL理解图片内涵）•加上"闪电手"Milvus（毫秒级匹配海量图
智能网关芯片：物联网连接的核心引擎
在物联网（IoT）生态系统中，智能网关芯片扮演着至关重要的角色，它是实现设备互联、数据转换和边缘计算的核心硬件。随着5G、人工智能（AI）和低功耗通信技术的快速发展，智能网关芯片的性能和功能不断提升，推动着智慧家居、工业物联网（IIoT）、智慧城市等领域的创新。智能网关芯片的关键技术智能网关芯片的核心能力在于其多协议支持能力。由于物联网设备采用不同的通信标准（如Wi-Fi、蓝牙、Zigbee、Lo
如何在 Apache Ignite 中创建和使用自定义 SQL 函数（Custom SQL Functions） lang20150928 其他 apache Ignite
这段内容讲的是如何在ApacheIgnite中创建和使用自定义SQL函数（CustomSQLFunctions）。我们可以分步骤来理解它的含义和用法。一、什么是CustomSQLFunction？ApacheIgnite的SQL引擎支持标准SQL函数（如COUNT、SUM、AVG等），但有时这些内置函数无法满足业务需求。这时，你可以通过编写Java代码，创建自己的SQL函数，并在SQL查询中使用它
Unity Catalog技术解析：数据与AI的统一元数据管理平台包幸慈Ferris
UnityCatalog技术解析：数据与AI的统一元数据管理平台什么是UnityCatalogUnityCatalog是一个开创性的开源元数据管理系统，专为现代数据与AI环境设计。作为业界首个真正通用的数据与AI资产目录，它解决了企业在多引擎、多格式环境下的元数据管理难题。核心特性解析1.多模态支持架构UnityCatalog的架构设计突破了传统元数据管理的局限：格式无关性：原生支持DeltaLa
Python, Go, Rust 开发全球海岛坐标定位APP Geeker-2025 python golang rust
以下是一个基于**Python、Go和Rust**协同开发的全球海岛坐标定位APP设计方案，结合三者的优势实现高精度地理计算、实时数据处理和跨平台部署：---###系统架构```mermaidgraphTDA[卫星遥感数据源]-->B(Python数据处理)B-->C{Rust地理引擎}C-->D[Go微服务集群]D-->E[移动端/Web端]E-->F[用户终端]```---###模块分工及技术
Python, C ++开发全国研学基地查询与管理APP Geeker-2025 python c++
以下是基于Python和C++开发全国研学基地查询与管理APP的技术方案，结合高性能数据处理、混合语言开发及教育行业合规性要求：---###**一、核心功能架构**```mermaidgraphTDA[用户端APP]-->B{API网关}C[管理端平台]-->BB-->D[Python业务微服务]D-->E[C++数据处理引擎]D-->F[时空数据库集群]E-->G[智能推荐系统]F-->H[可视
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR