相关文章
LLM推理--vLLM解读
主要参考: vLLM核心技术PagedAttention原理
总结一下 vLLM 的要点:
Transformer decoder 结构推理时需要一个token一个token生成,且每个token需要跟前序所有内容做注意力计算(包括输入的prompt和该token之前生成的token…
建站知识
2025/2/6 5:22:59
Ubuntu22.04如何设置linux-lowlatency核心
在Ubuntu上设置 linux-lowlatency 内核可以帮助减少系统延迟,适合需要低延迟环境的任务(如音频处理、实时应用等)。以下是设置步骤:
1. 更新系统
首先,确保系统是最新的:
sudo apt update
sudo apt upgr…
建站知识
2025/2/6 5:17:51
Java进阶--IO流
一、File类
概念:代表物理盘符中的一个文件或者文件夹。
常见方法
方法名
描述
createNewFile()
创建个新件。
mkdir()
创建个新录。
delete()
删除件或空录。
exists()
判断File对象所对象所代表的对象是否存在
getAbsolutePath()
获取件的绝对路径 …
建站知识
2025/2/6 5:14:44
kakailio官网推荐的安装流程ubuntu 22.04
https://kamailio.org/docs/tutorials/6.0.x/kamailio-install-guide-git/
# 非必须项
wget -O- https://deb.kamailio.org/kamailiodebkey.gpg | gpg --dearmor | sudo tee /usr/share/keyrings/kamailio.gpg在/etc/apt/sources.list文件追加以下内容
deb [signed-by/usr/sh…
建站知识
2025/2/6 5:09:32
java中的锁面试题
1、多线程中 synchronized 锁升级的原理是什么?
synchronized 是JVM层面的锁,是 Java 关键字,通过 monitor 对象来完成,synchronized 的实现涉及到锁的升级,具体为无锁、偏向锁、自旋锁、重量级锁 synchronized 锁升级…
建站知识
2025/2/6 5:06:27
体验 DeepSeek 多模态大模型 Janus-Pro-7B
含有图片的链接: https://mp.weixin.qq.com/s/i6kuVcGU1CUMYRPDM-bKog?token2020918682&langzh_CN
继上篇文章下载了 Janus-Pro-7B 后,准备本地运行时发现由于电脑配置配置太低(显存小于24G),无法运行࿰…
建站知识
2025/2/6 5:05:24
机器学习之数学基础:线性代数、微积分、概率论 | PyTorch 深度学习实战
前一篇文章,使用线性回归模型逼近目标模型 | PyTorch 深度学习实战
本系列文章 GitHub Repo: https://github.com/hailiang-wang/pytorch-get-started
本篇文章内容来自于 强化学习必修课:引领人工智能新时代【梗直哥瞿炜】 线性代数、微积分、概率论 …
建站知识
2025/2/6 5:01:17
rocketmq架构
1.架构图 RocketMQ的四层架构:
1.1 客户端层(Clients):
Producer集群:
(1)DefaultMQProducer:普通消息生产者
(2)TransactionMQProducer:事务…
建站知识
2025/2/6 4:59:15