从PDF提取内嵌字体的一些尝试和方法(文中有Python读取字体的PostScript名称等信息、Python自动化操作FontForge修改字体的脚本,需想学习下修改系统字体的可以进来了解下)

最近客户和我们提出一个标签唛头字体不正确的问题,用Adobe Illustrator打开后提示没有字体,之前我没有注意,直接导入了Adobe Illustrator替换的缺省字体,导致唛头的条码下面数字的字体不对了。具体请见下面的对比图:

刚开始接手这个问题的时候,我的想法很简单,就是到网上找一个一样的字体就好了,但是事实上却遇到了一系列的坑,当然我从中也学到了很多,请看我下面的分解教程。

首先,我使用了ChatGPT和Copilot搜索了下,怎么找相同的字体,它们推荐了我一些网站,至于效果,我只能说,如果使常用字体的话,还是有可能找到的比如这个网站

字体下载,字体大全,免费字体下载,在线字体|字客网 (fontke.com)https://www.fontke.com/而下面的这个网站是它的子网站,可以在线识别图片中的字体,并给出相似的字体

识字体网-在线图片字体识别扫一扫网站 (likefont.com)

字客网提供了字体名称搜索和字体图片搜索,如果你没有字体,这个网站很推荐,虽然是收费网站,但是如果关注它的公众号,每月24号都能领一个z码,可以免费兑换一个字体,为什么我推荐这个网站那,因为最后我的字体问题,有一半是通过它解决的,因为我不能凭空造出完整的字体,那样工作量太大了。

当然了网上这种网站很多,我只是举个例子,大家还是根据实际情况寻找合适自己的。

接着说下去,我本来想既然已经是AI时代了,这种找字体的网站,必定能找到我需要的字体,但是实际并不是我想象的这么简单的,因为字体的差别其实是很大的,就是同一个名字的字体，还有不同的版本，甚至同一个版本也可能因为修改过,会也有细微差别。为了此文不要太长,我简单写下,使用这个网站的过程。

我通过上面的https://www.likefont.com/上传了我在PDF原稿标签里截取的数字的图片，并使图片长宽符合网站标准的,并调整了阈值使网站在识别每个字体时,都能显示出完整的字体，填入帮助网站识别的实际数字,请看下图:

当上面图中的红框中的数字，都按照蓝框的数字填好后,下拉到最后有一个提交按钮,然后就等网站自动识别，我的结果如下:

显然网站标注的相似度并没有参考价值,因为第一个字体和我的字体差的有点大(仔细看第一个数字5的上沿角就知道了),继续往下翻一翻,发现有一个字体看上去还有点像,如图:

请记住这个字体名称(ZauriSans Italic R Regular)既然差不多,我就下载下来看看,因为第一次游客下载好像并没有要收费,也不要z码，人品问题?

正当我兴匆匆导入到C:\Windows\Fonts安装字体并打开AI尝试后,发现两种字体还是很点差别的,因为AI打开后字体不对,所以我想了个办法,先用Adobe Acrobat Pro打开原稿PDF文档,放大倍数后,截一张高清条码的高清图片,然后覆盖到AI打开的错误字体的文档中,但是因为条码是图片,所以我只要调整比较后,插入的高清截图文字也就和原稿显示的差不了多少了,这时再把我们设置好的新字体数字调整透明度后叠上去,看看效果。

(PS:其实我事后写此文时,发现如果不用修改条码文字的话,使用高清截图覆盖也不失为一个临时方法,当然了,我今天主要想把我整个解决的思路分享给大家,因为现在进入AI时代后,大家潜意识有一种快消思维,也就是想马上获得一个问题的答案,而不是耐下心来,一步步的解决问题,GPT是没有错,但是我们搞技术的总会碰到GPT，甚至高手一下子解决不了的问题,这时我们就需要越挫越勇的耐心和坚定不移的恒心来解决问题了。)

实际的对比结果如下图:

我这里给大家看的图片是只修改了字体的大小,而没有在AI中修改字符设置,字符设置可以设置字体的长宽比例,我只是想说明一个问题,PDF中的字体也是拉伸过的,就是同一种字体也很难相同,除非是图片.

如上面的图片，大家一定想知道字符设置后的是怎么样的,我给大家看一下:

显然如果粗略看的话,相似度已经达到95%,但是把单个数字放大看的话,还是稍微有点点的不同.比如说5和7的上沿，如果是使用AI、PS的文稿绘图人员看到这里也就可以了，但是我们这里是CSDN论坛,不发点代码怎么也说不过去吧,所以程序员请看下面的部分。

下半部分,我将介绍怎么从PDF提取出字体，尽量做到还原原稿,首先,用Adobe Acrobat Pro打开PDF，点击文件-属性。

然后在打开的对话框中切换到字体,如图:

可以看到上图中条码字体是Courier的字体,而且是显示未知类型,下面的Helvetica是唛头中的其他文字字体不做研究.我尝试了下用在线网站和软件都导不出这个Courier字体,需要在线导出字体网站的同学可以看下面:

如何将PDF中的嵌入字体提取为有效字体文件？-腾讯云开发者社区-腾讯云 (tencent.com)https://cloud.tencent.com/developer/ask/sof/74498这个帖子中(http://www.extractpdf.com)这个网站还不叫靠谱点，但是导不出我的Courier字体,因为使用很方便，也就不介绍了。

现在也不管这个Adobe Serif MM是不是老外原始的字体，纯粹研究一下吧!从开始介绍的那个字体网站就能搜索到这个字体,如下链接:Adobe Serif MM-字体搜索-字客网 (fontke.com)

发现有很多版本,输入我的条码数字比较下,发现V0版本还比较像,那就下载试试吧，然后就是扫二维码加公众号,注册并领取z码后等24小时开通账号,来使用这个z码免费下载,请看如下截图们:

下载解压后，如图所示:

这个Adobe Serif MM.otf文件就是我们下载的字体,但是发现后缀没看到过,安装到C:\Windows\Fonts看看,发现记事本、word等都可以用这个字体,但是就是Adobe系列的识别不了，也尝试了下网上千奇百怪的方法,发现都没啥用,既然没方法,就靠自己,因为之前搜索中有一个帖子说，字体的文件名，和字体在AI等软件中显示的名字可能是不一样的，先看看这个字体的实际postscript的名称到底是多少, 本来简单点用fontforge查看的,但是里面的Element-Font Info里写了好几个名称,因为之前没深究过字体也没用过fontforge，不确定哪个是PostScript名称,如图:

既然不了解,就扫扫盲,找到这个帖子

使用fontTools解析字体文件name数据表_字库文件加载字体 head cmap glyf bitmap-CSDN博客https://blog.csdn.net/qq_37941538/article/details/123889167

这个作者也牛,用python透彻的分析了字体文件的结构,使用了python的fontTools库,安装方法:

pip install fonttools

至于怎么获得PostScrpt的代码,作者只说明了原理,没有写出来,我就自己写了个,如下:

from fontTools.ttLib import TTFont

fontPath = "E:\\我的文档\\桌面\\Adobe Serif MM.otf"#替换你自己的字体路径
fontObj = TTFont(fontPath)
nameTable = fontObj["name"]
oldPlatformID = ""
b = ""
for s in nameTable.names:
    if  oldPlatformID != s.platformID:
        if s.platformID == 0:
            print("----------------平台:Unicode----------------")
        elif s.platformID == 1:
            print("----------------平台:Mac--------------------")
        elif s.platformID == 3:
            print("----------------平台:Window-----------------")
    if s.platformID == 0:
        b = "(U) "
    elif s.platformID == 1:
        b = "(M) "
    elif s.platformID == 3:
        b = "(W) "

    if s.nameID == 0:
        print(b,"Copyright:\t",s)
    elif s.nameID == 1:
        print(b,"Font Family:\t",s)
    elif s.nameID == 2:
        print(b,"Font Subfamily:\t",s)
    elif s.nameID == 3:
        print(b,"Unique font identifier:\t",s)
    elif s.nameID == 4:
        print(b,"Full font name:\t",s)
    elif s.nameID == 5:
        print(b,"Version:\t",s)
    elif s.nameID == 6:
        print(b,"PostScript:\t",s)
        print("--------------------------------------------")
    oldPlatformID = s.platformID

运行结果如下图:

所以我们这个字体的AI中的名称应该为AdobeSerifMM,找了下,还是没有,不过这个脚本还是提供给大家研究。

既然此路走不通,喝口茶再想想吧。

刚刚在AI文件中翻来翻去的找,我突然看到了熟悉的一个名字,如图:

突然,一个奇妙的思路出现,既然AI找不到AdobeSerifMM,把这个AdobeSerifMM里的字体用FontForge替换到ZauriSans Italic R里面不就好了。然后,我在FontForge这个软件中(官方网站是这个FontForge 开源字体编辑器)一番尝试,找到基本方法,如下:

1.打开需要复制的字体文件(如:AdobeSerifMM)选中一个字符(需要导出的原字体AdobeSerifMM字符),比如说5,然后右击,在菜单中选择New outline Window

然后在弹出的窗口,点击File-Export导出数字5

格式选择为EPS，点击Save保存.(因为这个软件没有中文,所以目录都是英文的,请记住保存目录,一般在我的文档中)

然后再打开刚刚我们AI中能识别的字体ZauriSansItalic-Regular.otf，点击下数字5，再点击File-Import导入.

找到之前导出的EPS格式文件目录,选择导出格式为EPS格式,点击Import。

这里导入选项默认即可。

可以比较下5傍边的4和6高度和宽度上字体都有点不一样,说明这个方法可行。

看了下FontForge的文档,好像支持Python,既然上面的方法可以字符互导, 我们用Python自动化操作看看,能不能成功。

与GPT一番扯皮后,有了基础代码,然后加了循环0-9数字并调试成功的代码如下:

import fontforge
import os
import tempfile  # 导入tempfile模块

def setStr(source_font,font,code):
    # 将源字体中的字符如“A”复制到一个变量中
    source_glyph = source_font[code]
    #如果不知道你的字符是什么名称请取消下一行注释
    #下句代码会返回如(),
    #这样你就知道你的字符名是nine,至于code的值可以参照fontforge软件中字符的序列号
    #如0可以写成source_font[48],1可以写成source_font[49]
    #print(source_glyph)

    # 创建临时文件来保存SVG
    temp_svg = tempfile.NamedTemporaryFile(suffix='.svg',delete=False)
    source_glyph.export(temp_svg.name)
    temp_svg.close()

    # 如果字符已经存在，先移除它
    if code in font:
        font.selection.select(code)  # 选择字符
        font.clear()  # 清除选中的字符

        # 创建一个新的字形
        font.createChar(source_glyph.encoding, code)

        # 导入SVG轮廓
        font[code].importOutlines(temp_svg.name)
        font[code].width = source_glyph.width
        font[code].vwidth = source_glyph.vwidth

    try:
        os.remove(temp_svg.name)
    except OSError as e:
        print("Error:delete %s : %s" % (temp_svg.name, e.strerror))

def main():
    # 打开源字体（包含你想复制的字符）
    source_font = fontforge.open('Adobe Serif MM.otf')
    print("已读取源文件")

    # 目标字体文件目录
    target_fonts = 'ZauriSansItalic-Regular.otf'
    #

    # 遍历目标字体文件并粘贴字符
    font = fontforge.open(target_fonts)
    print("已读取目标文件")

    num = ["zero", "one", "two", "three", "four", "five", "six", "seven", "eight", "nine"]

    # 把源字体中的0-9数字替换到目标字体的0-9
    for i in range(0,10):
        print("数字" + str(i) + ": 替换中...")
        setStr(source_font,font,num[i])
        print("已完成")
    #setStr(source_font,font,48)#测试数字0的另一种写法,只供调试code值所用,实际运行
    #后面代码会报错.注意需把第12行代码取消注释,才能使用这个功能    

    # 保存更改
    font.generate(target_fonts)
    print("已更新文件")
    font.close()

    # 关闭源字体文件
    source_font.close()
    print("已关闭文件")

if __name__ == "__main__":
    main()

编写代码时,有个坑,就是数字0-9的code变量都是英文(也就是num = ["zero", "one", "two", "three", "four", "five", "six", "seven", "eight", "nine"]),而A-Z的因为还是A-Z。

FontForge运行脚本的方法比较特殊,有两种,一种是在主程序的File菜单里选择Execute Script，然后把代码复制到框里运行,下面选择Python模式，但是这个方式的弊端就是看不出python脚本出错的位置,不方便调试。另一种是WINDOW命令提示符运行,如下格式:

fontforge -script C:\Users\Dong\Desktop\fontForge_CopyScript.py

-script后的参数填写自己保存的py格式python脚本目录就可以了.如下图运行成功的截图:

(PS：注意代码中需传入自己的字体文件目录名,默认是在你window的USER目录,也就是你的用户名目录)

既然有了文件,把之前的老的ZauriSansItalic-Regular.otf，在C:\Windows\Fonts中删除掉,安装替换新数字的ZauriSansItalic-Regular.otf即可。

打开AI后,可以看到有着Adobe Serif MM数字的ZauriSansItalic-Regular.otf加载成功了,说明这个方法可行。我做了个对比图，比较替换前后ZauriSansItalic-Regular.otf的符合率.

显然原版的ZauriSansItalic-Regular.otf字体更符合PDF原档显示的字体,但是和老外原稿还是有点稍微不同,字体比较粗,可能是AI字符比例还没有到最佳状态,这就是后话了.

当然我们不是做了白用功,我们还是通过这个案例学到了很多python的运用,开拓了视野,任何知识学了总是有用的,说不定哪天你就会派到用处了,到时你就会感到,你今天看的东西物有所值了,谢谢耐心的粉丝能看完,你已经赢了!

【Python】一文详细介绍 py格式文件高斯小哥 Python基础【高质量合集】python 新手入门学习
【Python】一文详细介绍py格式文件个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、Python领域的优质内容！（希望得到您的关注~）文章目录一、py格式文件简介二、如何创建和编辑py格式文件三、如何运行py
python抓包与解包_Python—网络抓包与解包（pcap、dpkt） weixin_39691055 python抓包与解包
pcap安装[root@localhost~]#pipinstallpypcap抓包与解包#-*-coding:utf-8-*-importpcap,dpktimportre,threading,requests__black_ip=['103.224.249.123','203.66.1.212']#抓包：param1eth_name网卡名，如：eth0,eth3。param2p_type日志捕
浪潮 M5系列服务器IPMI无法监控存储RAID卡问题. Songxwn 硬件服务器服务器运维
简介浪潮的M5代服务器，可能有WebBMC无法查看存储RAID/SAS卡状态的情况，可以通过以下方式修改。修改完成后重启BMC即可生效。ESXiIPMITools使用：https://songxwn.com/ESXi8_IPMI/（Linux也可以直接使用）Linux/ESXiIPMITool下载：https://songxwn.com/file/ipmitoolWindows下载：https:/
华为OD机试 - 单向链表中间节点（Java & JS & Python & C & C++）华为OD题库华为od 链表 java
须知哈喽，本题库完全免费，收费是为了防止被爬，大家订阅专栏后可以私信联系退款。感谢支持文章目录须知题目描述输出描述解析代码题目描述给定一个单链表L，请编写程序输出L中间结点保存的数据。如果有两个中间结点，则输出第二个中间结点保存的数据。例如：给定L为1→7→5，则输出应该为7；给定L为1→2→3→4，则输出应该为3；输入描述每个输入包含1个测试用例。每个测试用例：第一行给出链表首结点的地址、结点总
python 推导式(派生、衍生) sanduo112 人工智能 python windows 开发语言
python推导式一、推导式(派生、衍生)1.Python推导式是一种独特的数据处理方式，可以从一个数据序列构建另一个新的数据序列的结构体。2.列表(list)推导式3.字典(dict)推导式4.集合(set)推导式5.元组(tuple)推导式二、代码概述一、推导式(派生、衍生)1.Python推导式是一种独特的数据处理方式，可以从一个数据序列构建另一个新的数据序列的结构体。Python支持各种数
数据挖掘|数据预处理|基于Python的数据标准化方法皖山文武数据挖掘数据建模与分析 python 数据挖掘开发语言
基于Python的数据标准化方法1.z-score方法2.极差标准化方法3.最大绝对值标准化方法在数据分析之前，通常需要先将数据标准化（Standardization），利用标准化后的数据进行数据分析，以避免属性之间不同度量和取值范围差异造成数据对分析结果的影响。1.z-score方法Z-score方法是基于原始数据的均值和标准差来进行数据标准化的，处理后的数据均值为0，方差为1，符合标准正态分布
CSV指南：Python程序获取大型CSV文件行数孤独打铁匠Julian 笔记经验分享 python
本指南提供了几种使用Python来获取大型CSV文件行数的方法，并解释了每种方法的适用场景。方法1:使用csv.reader处理复杂CSV文件当你的CSV文件中包含多行字段（即某些字段的值中包含换行符）时，使用csv.reader是一个可靠的选择，因为它能够正确处理这些复杂情况。这个方法适用于大多数大小的CSV文件，但是对于非常大的文件，读取整个文件可能会占用较多的时间和内存。对于极大的文件，考虑
谷歌浏览器驱动Chromedriver（114-120版本）文件以及驱动下载教程 pigerr杨 Python python chrome drivers
ChromeDriver官方网站GitHub||GoogleChromeLabs/chrome-for-testingChromeDriver113-125_JSONChromeforTestingavailability123-125zip白月黑羽Python基础|进阶|Qt图形界面|Django|自动化测试|性能测试|JS语言|JS前端|原理与安装
大创项目推荐深度学习 opencv python 公式识别(图像识别机器视觉) laafeer python
文章目录0前言1课题说明2效果展示3具体实现4关键代码实现5算法综合效果6最后0前言优质竞赛项目系列，今天要分享的是基于深度学习的数学公式识别算法实现该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：4分创新点：4分更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1课题
Acrobat Pro DC ----专业PDF编辑与管理 *橙子 office pdf macos
AcrobatProDC2023是一款功能强大的PDF处理软件，它提供了丰富的编辑工具，支持创建、编辑、合并、分割PDF文件，以及高质量的PDF到其他格式的转换功能。同时，该软件集成了最新的OCR技术，可将扫描文档或图片转换成可编辑的PDF。AcrobatProDC2023还具备电子签名功能，支持多人协作和云端同步共享，大大提高了工作效率和团队协作效率。无论是设计、建筑、金融还是法律等行业，Acr
python转码 Desamond python 开发语言
转码在许多场景中都有应用，以下是一些常见的场景：网页开发：当用户在网页上输入文本时，可能需要将特殊字符（如空格、引号、特殊符号等）进行转码，以防止这些字符对URL或HTML代码产生干扰。文件名处理：在处理文件名时，可能需要将特殊字符进行转码，以避免文件名被错误地解析或显示。数据传输：在数据传输过程中，为了确保数据的完整性和正确性，可能需要将数据中的特殊字符进行转码。数据存储：在数据库或数据存储中，
排序算法太多？常用排序都在这了，一篇文章总结和实现所有面试会考的排序算法（基于Python实现）宇宙之一粟不归路之Python #IT面试题收集与总结数据结构与算法算法数据结构排序算法 python java
文章目录排序算法1.常见的排序算法1.1选择排序1.1.1思想1.1.2实现**1.1.3选择排序分析**1.2冒泡排序**1.2.1思想****1.2.2实现****1.2.3冒泡排序分析**1.3插入排序**1.3.1思想****1.3.2实现****1.3.3插入排序分析**1.4归并排序☆☆★**1.4.1思想****1.4.2实现****1.4.3归并排序分析**1.5快速排序☆★★**
27.Python从入门到精通—Python异常处理抛出异常用户自定义异常定义清理行为预定义的清理行为以山河作礼。 #Python基础入门—详解版 python java 服务器
27.从入门到精通：Python异常处理抛出异常用户自定义异常定义清理行为预定义的清理行为异常处理抛出异常用户自定义异常定义清理行为预定义的清理行为异常处理在Python中，异常处理是一种处理程序在执行期间可能遇到的错误的方法。当Python解释器遇到错误时，它会引发异常。异常是一种Python对象，它包含有关错误的信息，例如错误类型和错误位置。为了处理异常，您可以使用try-except语句。在
python清华大学出版社答案_Python机器学习及实践 weixin_39805119 python清华大学出版社答案
第1章机器学习的基础知识1.1何谓机器学习1.1.1传感器和海量数据1.1.2机器学习的重要性1.1.3机器学习的表现1.1.4机器学习的主要任务1.1.5选择合适的算法1.1.6机器学习程序的步骤1.2综合分类1.3推荐系统和深度学习1.3.1推荐系统1.3.2深度学习1.4何为Python1.4.1使用Python软件的由来1.4.2为什么使用Python1.4.3Python设计定位1.4.
C++ pdf 打印插入图片灿烂李 java 前端服务器
一：使用PODOFO给PDF插入图片：#includeintmain(){PoDoFo::PdfMemDocumentpdfDocument;PoDoFo::PdfPage*page;PoDoFo::PdfImageimage;PoDoFo::PdfVecObjects*vec_objects;PoDoFo::PdfRectrect;//打开PDF文档pdfDocument.loadFromFil
Python | Redis工具类 -拟墨画扇- Python redis 数据库缓存 python
一、需求自动连接Redis数据库，通过连接池处理数据对输出结果进行Log打印并保存到文件二、代码Utils.redisUtils.py#!/usr/bin/envpython#-*-coding:utf-8-*-importredisfromUtils.loggerimportlog"""Redis数据格式(1)字符串|存储形式:key-value:str-存储二进制数据:可以存储任意类型的数据，
Python dict字符串转json对象，小数精度丢失问题朝如青丝暮成雪 json python
一前言JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式，dict是Python的一种数据格式。本篇介绍一个float数据转换时精度丢失的案例。二问题描述importjsontest_str1='{"π":3.1415926535897932384626433832795028841971}'test_str2='{"value":10.00000}'print
C语言演示多线程编程条件下自旋锁和屏障的使用嫦娥妹妹等等我开发语言 c语言开源
主线故事:有4个人玩游戏输了,惩罚:1分别使用4台不同的ATM机给我存钱2必须一块一块的存3存完还得在ATM上看一下我的余额设计模式:1每个人使用一条单独的线程,再准备一个计时线程用来输出时间2存钱涉及到对共享资源的读写,是原子操作需要用锁保护这里使用自旋锁3都存完钱后需要等待在各自的ATM上回显余额这里使用屏障技术4如果在主线程中回显对应他们给我打电话告诉我存完了我自己看一下则不需要使用屏障因为
Python+Requests模拟发送GET请求爱学习的执念自动化测试软件测试技术分享 python 开发语言
模拟发送GET请求前置条件：导入requests库一、发送不带参数的get请求代码如下：以百度首页为例importrequests#发送get请求response=requests.get(url="http://www.baidu.com")print(response.content.decode("utf-8"))#以utf-8的编码输出内容二、发送带参数的get请求发送带参数的get请求有
Python极速入门：五分钟开启实战之旅！知白守黑V Python 编程语言系统运维 python 编程语言 python开发 python学习 python入门 python数据分析
1.Python基础语法和结构：了解Python的基本语法，包括变量、数据类型、运算符、注释等。控制流：掌握条件语句（if-elif-else）、循环（for和while）及其控制（break和continue）。函数：学习如何定义和使用函数，包括参数传递、返回值、作用域和闭包。模块和包：理解如何导入和使用模块，以及如何创建和使用自己的包。2.数据处理列表、元组和集合：学习这些序列类型的操作和方法
java基础相关面试题详细总结。。。。。96 java 开发语言
1.Java中的数据类型有哪些？答：Java中的数据类型包括基本数据类型（如整数、浮点数、字符等）和引用数据类型（如类、接口、数组等）。2.什么是面向对象编程（OOP）？答：面向对象编程是一种编程范式，它将数据和对数据的操作封装在一起，形成对象。通过对象之间的交互来实现程序的功能。3.解释类和对象的关系。答：类是对象的抽象描述，而对象是类的具体实例。一个类可以创建多个对象，每个对象都具有类中定义的
Python Flask 使用数据库安果移不动 python flask 开发语言
pipinstallflask_sqlalchemy官方文档：Flask-SQLAlchemy—Flask-SQLAlchemyDocumentation(3.1.x)为了不报错也需要导入另外两个库#pipinstallflask_sqlalchemy#pipinstallmysqlclient完整代码importosfromflaskimportFlaskfromflask_sqlalchemy
PaperWeekly sapienst Papers PaperwithCode General ML
1.Python软件包解决DL在未见过的数据分布下性能差的问题：（1）神经网络和损失分离的模块化设计（2）强大便捷的基准测试能力（3）易于使用但难以修改（4）github:https://github.com/marrlab/domainlabTrainer和Models之间是什么关系Trainer和Models是DomainLab中的两个核心概念。Trainer是一个用于指导数据流向模型并计算S
使用Python读取Excel文件并计算平均分嘻嘻爱编码 Python从入门到放弃 python excel 开发语言
在这篇博客中，我们将探讨如何使用Python的pandas库来读取Excel文件，并计算其中数据的平均分。pandas是一个强大的数据分析工具，它允许我们以简单直观的方式处理表格数据。安装必要的库在开始之前，确保你的环境中安装了pandas和openpyxl库。可以使用以下命令进行安装：pipinstallpandasopenpyxl读取Excel文件首先，我们需要读取Excel文件。假设我们有一
Java面试题：解释JVM的内存结构，并描述堆、栈、方法区在内存结构中的角色和作用，Java中的多线程是如何实现的，Java垃圾回收机制的基本原理，并讨论常见的垃圾回收算法杰哥在此 Java系列 java jvm 算法面试
Java内存模型与多线程的深入探讨在Java的世界里，内存模型和多线程是开发者必须掌握的核心知识点。它们不仅关系到程序的性能和稳定性，还直接影响到系统的可扩展性和可靠性。下面，我将通过三个面试题，带领大家深入理解Java内存模型、多线程以及并发编程的相关原理和实践。面试题一：请解释JVM的内存结构，并描述堆、栈、方法区在内存结构中的角色和作用。关注点：JVM内存结构的基本组成堆、栈、方法区的功能和
python项目练习——7.网站访问日志分析器 F—— python项目练习 python 信息可视化数据分析数据挖掘开发语言学习
项目功能分析：这个项目可以读取网站的访问日志文件，统计访问量、独立访客数、访问来源等信息，并以图表或表格的形式展示出来。这个项目涉及到文件操作、数据处理、数据可视化等方面的技术。示例代码：importrefromcollectionsimportCounterimportmatplotlib.pyplotaspltdefparse_log_file(log_file):#读取日志文件内容witho
python的while双重循环九九乘法表 Jinm_R python 开发语言
a=1whilea<=9:b=1#乘数每次需要从1开始whileb<=a:print(f"{a}*{b}={a*b}\t",end='')#\t为制表符使乘法表整齐end=''代表用空格代替换行b+=1a+=1print()#乘数每加一换行
macOS安装mongoDB（homebrew） lx741602698 macos mongodb 数据库
使用HomebrewHomebrew是macOS的一个包管理器，可以非常方便地安装MongoDB和其他软件。如果你还没有安装Homebrew，可以从它的官网上找到安装指令。已安装Homebrew的话，先更新一下homebrewbrewupdate你可以使用下面的命令来安装MongoDB的社区版：brewtapmongodb/brewbrewinstallmongodb-community安装完成后
ChatGPT技巧大揭秘：AI写代码新境界 2401_83550420 chatgpt4.0 chatgpt chatgpt 人工智能 AI写作
ChatGPT无限次数:点击直达ChatGPT技巧大揭秘：AI写代码新境界随着人工智能技术的不断进步，开发人员现在有了更多有趣的工具来提高他们的工作效率。其中，ChatGPT作为一种基于深度学习的自然语言处理模型，已经成为许多开发者的新宠。在本文中，我们将揭秘使用ChatGPT来帮助编写代码的技巧，探索AI在编程领域的新境界。ChatGPT简介ChatGPT是一种基于大型神经网络的对话生成模型，它
【Python】成功解决ModuleNotFoundError: No module named ‘torchinfo‘ 高斯小哥 BUG解决方案合集 python pytorch 新手入门学习 debug
【Python】成功解决ModuleNotFoundError:Nomodulenamed‘torchinfo’个人主页：高斯小哥高质量专栏：Matplotlib之旅：零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程希望得到您的订阅和支持~创作高质量博文(平均质量分92+)，分享更多关于深度学习、PyTorch、Python领域的优质内容！（希望得到您的关注~）文
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found

从PDF提取内嵌字体的一些尝试和方法(文中有Python读取字体的PostScript名称等信息、Python自动化操作FontForge修改字体的脚本,需想学习下修改系统字体的可以进来了解下)

你可能感兴趣的:(编程技术学习,pdf,python,windows,macos)