找回密码
 立即注册
探秘Transformer系列之(24)--- KV Cache优化
探秘Transformer系列之(24)--- KV Cache优化 目录 [*]探秘Transformer系列之(24)--- KV Cache优化 [*]0x00 前言 [*]0x01 背景知识 [*]1.1 度量指标 [*]1.1.1 吞吐量 [*]1.1.2 延迟 [*]1.2 内存危机 [*]1.3 KV Cache问题 [*]0 ...
煅汾付 2025-6-2 22:44
354 0 0
qwen3 惊喜发布,用 ollama + solon ai (java) 尝个鲜
qwen3 惊喜发布了,帅!我们用 ollama 和 solon ai (java) 也来尝个鲜。 1、先用 ollama 拉取模型 听说,在个人电脑上用 4b 的参数,效果就很好了。 2、试试:Hello qwen3 用 solon-initializr ( https://solon.noear.org/start/ ),生 ...
砂歹汤 2025-6-2 22:44
812 0 0
【译】使用自适应粘贴轻松调整代码
  您是否经常在实际项目中修改粘贴过来的代码?Visual Studio 2022 引入了使用 Copilot 调整粘贴代码的功能,以减少您花费在进行繁琐更改上的时间。 通过自适应粘贴简化手工代码修改   当您复制和粘贴代码时,这个过程通常伴随着额 ...
嗳诿 2025-6-2 22:44
114 0 0
C#网络编程(二)----网络层/链路层
网络层协议 网络层(Network Layer) 的主要功能是实现主机之间的逻辑寻址、路由选择和分组转发,确保数据在不同网络(如局域网、广域网)之间的传输 IP IP(Internet Protocol),是分配给连接到计算机网络的每个设备唯一标识符,用于在 ...
告陕无 2025-6-2 22:44
1021 0 0
向商界大佬一样管理技术工作 - 以团队换将+技术重构为例
背景 我们虚拟一个背景: 你是一个技术团队 Leader, 近期正在主导"去IOE", "国产替代", "信创" 等技术重构工作. 但是在紧要关头, 一名下属因不可抗力离职, 并且因为之前"开源节流", 其所负责部分技术无备岗. 这时候, 我们就需要请出诸位 ...
溶绚 2025-6-2 22:44
436 0 0
国内首个「混合推理模型」Qwen3深夜开源,盘点它的N种对接方式!
今日凌晨,通义千问团队正式开源了 Qwen3 大模型,并且一口气发布了 8 个型号,其中包括 0.6B、1.7B、4B、8B、14B、32B 以及 30B-A3B 和 235B-A22B,使用者可以根据自己的业务情况,选择合适的版本进行使用。 更让人惊喜的是,最新的 Qwe ...
祺簇 2025-6-2 22:44
436 0 0
经过几天的努力Biwen.AutoClassGen终于实现了DTO复杂属性的生成
前言 距写上一篇 https://www.cnblogs.com/vipwan/p/18535459 生成DTO已经有一段时间了, 最初没有考虑复杂二级属性嵌套的实现,而是直接使用排除使用自定义的方式解决这个问题, 但是这个有些违背简约到底的初衷,并且也有好几个网友提出希 ...
鞣谘坡 2025-6-2 22:44
423 0 0
AI Agent现实应用与未来展望:从个人到社会的变革(下篇)
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除 免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
刘凤 2025-6-2 22:44
723 0 0
根据点信息生成道路以及路口
               一、目标   1. 生成道路:通过提供的一些随机的点信息,自动扩展成一定宽度的道路,道路具有路沿点、道路中心点分上下行车道,点的方向根据实际车道运行的方向生成。   2. 生成路口:如果多天道路之间有相 ...
城徉汗 2025-6-2 22:43
575 0 0
使用的架构是否满足微服务设计思想?
1、前言        微服务架构是现在很火的流行技术,大家都朝着微服务化的方向转型,但是我要给大家泼一泼冷水,也许有些架构根本满足不了微服务思想,只是新的第三方框架替换老框架的换汤不换药的做法,还有一些只是满足了现有公司 ...
愆蟠唉 2025-6-2 22:43
315 0 0
经典面试题目“OOM异常会导致JVM退出吗?”
经典面试题目“OOM异常会导致JVM退出吗? 我的回答是“这要分情况看,对于守护线程来说,OOM并不会导致JVM退出;对于非守护线程来说,如果某个线程捕获了OOM异常并处理异常后线程并未退出,那JVM并不会退出;如果线程没有捕获Error异常, ...
路逸思 2025-6-2 22:43
819 0 0
GBDT算法原理及Python实现
一、概述   GBDT(Gradient Boosting Decision Tree,梯度提升决策树)是集成学习中提升(Boosting)方法的典型代表。它以决策树(通常是 CART 树,即分类回归树)作为弱学习器,通过迭代的方式,不断拟合残差(回归任务)或负梯度( ...
玻倌瞽 2025-6-2 22:43
288 0 0
Web前端入门第 44 问:CSS 循环动画 animation 效果演示
相关属性 @keyframes 定义动画的关键帧序列 animation-name 指定 @keyframes 动画的名称 animation-duration 动画单次循环的持续时间(必需属性,否则动画不会生效) animation-timing-function 动画速度曲线 animation-iteration-count ...
袁可佳 2025-6-2 22:43
280 0 0
毛玻璃实现交友软件心动嘉宾模糊效果
线上效果图 思路分析 图片我们使用背景图片的方式插入 如果我们的图片大于容器的话 我们使用background-size: cover 进行比例缩放,覆盖整个容器 毛玻璃效果使用 backdrop-filter 来进行处理,值越大模糊程度越大 使用毛玻璃实现图片模 ...
泡市 2025-6-2 22:43
814 0 0
探秘Transformer系列之(31)--- Medusa
探秘Transformer系列之(31)--- Medusa 目录 [*]探秘Transformer系列之(31)--- Medusa [*]0x00 概述 [*]0x01 原理 [*]1.1 动机 [*]1.2 借鉴 [*]1.3 思路 [*]1.3.1 单模型 & 多头 [*]1.3.2 Tree 验证 [*]1.3.3 小结 [*]0x02 设 ...
这帜 2025-6-2 22:43
401 0 0
函数回调的本质和原理
目录 [*]把函数当参数 [*]可以异步的函数 [*]案例背景:模拟文件上传 [*]同步代码的问题 [*]异步回调解决方案 [*]为什么异步回调解决了同步无法处理的问题? [*]实际开发中会用到的异步回调 [*]总结 函数回调的定义: 通俗地讲,把一 ...
濮阳雅爱 2025-6-2 22:43
345 0 0
HarmonyOS运动开发:如何监听用户运动步数数据
前言 在开发运动类应用时,准确地监听和记录用户的运动步数是一项关键功能。HarmonyOS 提供了强大的传感器框架,使得开发者能够轻松地获取设备的运动数据。本文将深入探讨如何在 HarmonyOS 应用中实现步数监听功能,同时分享一些开发过程 ...
喳谍 2025-6-2 22:43
261 0 0
Nacos源码—1.Nacos服务注册发现分析一
大纲 1.客户端如何发起服务注册 + 发送服务心跳 2.服务端如何处理客户端的服务注册请求 3.注册服务—如何实现高并发支撑上百万服务注册 4.内存注册表—如何处理注册表的高并发读写冲突   1.客户端如何发起服务注册 + 发送服务心跳 (1)Na ...
黎娅茜 2025-6-2 22:43
783 0 0
什么是微前端?有什么好处?有哪一些方案?
微前端(Micro Frontends) 微前端是一种架构理念,借鉴了微服务的思想,将一个大型的前端应用拆分为多个独立、自治的子应用,每个子应用可以由不同团队、使用不同技术栈独立开发和部署,最终聚合为一个整体产品。 来源:程序园用户自 ...
富账慕 2025-6-2 22:42
1017 0 0
Sunshine+Moonlight让安卓Pad或IPad变6ms低延迟高质量无线显示器 #串流 #无线副屏
1、背景   最近看到多个博主在分享局域网或者公网使用Sunshine+Moonlight串流技术,将电脑画面投屏到其他屏幕(电视、安卓和苹果平板等等),宣称是个位数的延迟,并且能用平板打steam游戏(对画面延迟要求很高),想到了之前用过的sp ...
窖咎 2025-6-2 22:42
287 0 0

快速发帖

还可输入 80 个字符
您需要登录后才可以发帖 登录 | 立即注册

本版积分规则