欢迎小主! 162导航

#数据生成#

  • 爱可可-爱生活 1天前 北京

    【Flow Matching:基于PyTorch的生成模型实现,通过流匹配技术将简单分布转换为复杂分布,用于生成高质量的数据样本】'Flow Matching implemented in PyTorch' GitHub: github.com/keishihara/flow-matching #生成模型# #PyTorch# #数据生成# #AI创造营#

  • 爱可可-爱生活 59天前 北京

    【Promptwright:一个用本地大型语言模型生成合成数据的Python库,提供灵活易用的接口,帮助用户创建由提示引导的数据集】'Generate large synthetic data using a local LLM' GitHub: github.com/StacklokLabs/promptwright #数据生成# #人工智能# #Python库#

  • 爱可可-爱生活 22天前 北京

    【Argilla-io 数据生成器:用自然语言构建数据集,助力AI训练和微调,让数据生成更简单快捷】'synthetic-data-generator - Build datasets using natural language' GitHub: github.com/argilla-io/synthetic-data-generator #数据生成# #自然语言处理# #AI训练# #AI创造营#

  • 爱可可-爱生活 178天前 北京

    【LLM在表格数据预测与理解相关资源列表】’LLM-on-Tabular-Data-Prediction-Table-Understanding-Data-Generation (tanfiona) - A Comprehensive Survey on Large Language Models for Tabular Data' GitHub: ...全文

  • 爱可可-爱生活 211天前 北京

    【Go-Faker:Go语言结构体假数据生成器,用于生成模拟数据,支持多种数据类型和自定义标签,适用于测试和开发】'go-faker/faker - Go (Golang) Fake Data Generator for Struct' GitHub: github.com/go-faker/faker #Go语言# #数据生成# #测试工具#

  • 爱可可-爱生活 82天前 北京

    【fastdata:轻量合成数据生成库,专为深度学习模型训练设计,能够快速生成用于语言模型训练的合成数据】'fastdata - a minimal library for generating synthetic data for training deep learning models' GitHub: github.com/AnswerDotAI/fastdata #深度学习# #数据生成# #机器学习#

丨话题榜