爱可可-爱生活 7天前 北京
【[128星]CUDA学习资源库:为初学者和进阶者准备的CUDA编程学习指南,包含丰富的教程、实用示例和优化技巧,帮助你轻松掌握GPU加速应用开发】'This repository is a curated collection of resources, tutorials, and practical examples designed to guide you through the journey of mastering CUDA ...全文
爱可可-爱生活 7天前 北京
【[128星]CUDA学习资源库:为初学者和进阶者准备的CUDA编程学习指南,包含丰富的教程、实用示例和优化技巧,帮助你轻松掌握GPU加速应用开发】'This repository is a curated collection of resources, tutorials, and practical examples designed to guide you through the journey of mastering CUDA ...全文
爱可可-爱生活 203天前 北京
【FlashAttention-3:GPU加速注意力机制算法,实现高效准确的语言模型处理,支持异步处理和低精度计算】《FlashAttention-3: Fast and Accurate Attention with Asynchrony and Low-precision | PyTorch》 🔗 #机器学习# #人工智能# #Transformer# #GPU加速# #长语言模型#
爱可可-爱生活 19天前 北京
【[95星]Kokoro-FastAPI:基于 Docker 的 FastAPI 包裹,用于 Kokoro-82M 文本到语音模型的部署,支持 NVIDIA GPU 和 CPU ONNX 加速推理,以及自动分割和拼接功能】'Dockerized FastAPI wrapper for Kokoro-82M text-to-speech model w/CPU ONNX and NVIDIA GPU PyTorch support, handling, and auto-s ...全文
爱可可-爱生活 68天前 北京
【Dynamiqs:基于JAX开发的高性能量子系统模拟库,支持GPU加速和可微分计算,可用于模拟薛定谔方程、林德布拉德主方程等量子系统,特别适合大规模量子系统仿真、基于梯度的参数估计和量子最优控制】 'High-performance quantum systems simulation with JAX (GPU-accelerated & differentiable solvers ...全文
爱可可-爱生活 108天前 北京
【FLUXSwift:基于Swift语言实现的Flux.1模型,利用mlx-swift库在苹果硅芯片上实现GPU加速,用于生成图像】'FLUXSwift is a Swift implementation of the FLUX.1 model, it uses the mlx-swift for gpu acceleration on Apple Silicon.' GitHub: github.com/mzbac/flux.swift #FLUXSwift# #图像生成# ...全文
爱可可-爱生活 140天前 北京
【Super-Monotonic-Alignment-Search:用于自监督方式估计配对语音和文本之间对齐的高效算法,特色在于可并行化处理、GPU加速且无需设备间拷贝】'super-monotonic-align - Triton-Lang and PyTorch implementation of the monotonic alignment search (MAS), originally from Glow-TTS.' GitHub: ...全文
爱可可-爱生活 101天前 北京
【Triton Windows:支持Windows系统的Triton语言和编译器,让免费软件也能在非自由平台上运行,特别适合需要在Windows上使用GPU加速的开发者】'woct0rdho/triton-windows: Fork of the Triton language and compiler for Windows support' GitHub: github.com/woct0rdho/triton-windows #Triton语言# ...全文