本文分类:news发布日期:2024/12/23 8:47:56
相关文章
使用vLLM和ChatGLM3-6b批量推理
当数据量大的时候,比如百万级别,使用 ChatGLM3-6b 推理的速度是很慢的。发现使用 vLLM 和 ChatGLM3-6b 批量推理极大的提高了推理效率。本文主要通过一个简单的例子进行实践。
1.安装 vLLM 和PyTorch [2]
除了 Python(本文使用 3.11&#x…
建站知识
2024/12/2 5:42:28
【优化】XXLJOB修改为使用虚拟线程
【优化】XXLJOB修改为使用虚拟线程 新建这几个目录 类, 去找项目对应的xxljob的源码
主要是将 new Thread 改为 虚拟线程
Thread.ofVirtual().name("VT").unstarted 以下代码是 xxljob 2.3.0版本 举一反三 去修改对应版本的代码
<!-- 定…
建站知识
2024/12/11 16:58:26
小白入门之安装MAVEN
重生之我在大四学JAVA
第六章 安装MAVEN 打开IDEA,配置MAVEN 打开Setting 找到上面设置的settings.xml文件地址 至此MAVEN也就安装成功了
附赠一个maven清理脚本,如果发现你的电脑maven下载不了jar,依赖爆红,可以试下下面bat脚…
建站知识
2024/12/16 1:47:28
Spring Boot学习随笔- 拦截器实现和配置(HandlerInterceptor、addInterceptors)、jar包部署和war包部署
学习视频:【编程不良人】2021年SpringBoot最新最全教程 第十三章、拦截器 拦截器 :Interceptor 拦截 中断 类似于javaweb中的Filter,不过没有Filter那么强大 作用 Spring MVC的拦截器是一种用于在请求处理过程中进行预处理和后处理的机制。拦…
建站知识
2024/11/21 17:05:57
第五章Netty第一节 粘包和半包
粘包与半包
粘包
现象:发送abc def,接受到abcdef 原因:
应用层:接收方ByteBuf设置太大(Netty默认是1024)传输层滑动窗口: 假设发送方256 bytes表示一个完整的报文,接收方的滑动窗口来不及处理…
建站知识
2024/11/21 12:06:12
nodejs连接mongodb报错SyntaxError: Unexpected token .
nodejs连接mongodb报错SyntaxError: Unexpected token 如下图 经过排查,原因是npm默认安装的mongodb插件是最新版6.3.0 ,而mongodb数据库版本是4.0.0 ,两者版本不同导致nodejs报错。 解决方法是npm卸载新版本的mongodb插件,再安…
建站知识
2024/12/21 23:05:20
零成本搭建一款博客网站(基于Vercel+Hexo完美实现)【保姆级教程】
文章目录 🐸基于VercelHexo零成本搭建博客网站🐻实现思路 🐮Hexo的配置与安装🐒Hexo的美化与使用🐫Github的推送与部署🐼Vercel部署与网站上线🐛总结 🐸基于VercelHexo零成本搭建博客…
建站知识
2024/11/21 12:12:13