DeepSeek发布统一图像理解与生成的Janus-Pro系列模型
1月27日晚,DeepSeek发布了Janus-Pro系列,旨在将图像理解和生成整合至单个模型中。该模型框架采用极简架构,将自回归语言模型与生成建模领域的前沿方法Rectified Flow相结合,在统一图像理解和生成方面取得了重要进展。
据涩橘的Telegram频道,Rectified Flow可以直接在大型语言模型框架内进行训练,无需复杂的架构修改。JanusFlow是一个支持图像多模态的LLM,参数量为70亿(7B),方便本地运行。训练方式采用传统的预训练和SFT,未使用强化学习。现有数据表明,JanusFlow在性能上超越了同参数量的其他模型,并且Janus-Pro在GenEval和DPG-Bench基准测试中击败了OpenAI的DALL-E 3和Stable Diffusion,这是一个重要的性能提升,表明其在文本到图像生成方面具有很强的竞争力。目前,线上演示平台尚未开放,详细技术报告也暂未上传。初步分析认为,JanusFlow旨在实现大模型视觉生成的端到端处理,相较之前的版本有所改进,但在图像生成质量上与专门的图像生成模型(如Stable Diffusion)相比仍有差距。模型输入输出分辨率为384x384。推测其技术实现可能整合了Rectified Flow、SigLIP和SDXL-VAE等架构,并将其集成到Transformer的解码器/编码器中,通过联合训练对齐语义向量。虽然该成果的震撼程度不及V3和R1等重大突破,但仍然值得期待其未来的发展潜力。
DeepSeek持续推动技术创新,即使在除夕也有新成果发布,充分展现了其强大的研发能力。虽然目前的JanusFlow在图像生成方面并非顶尖水平,但它为未来更大规模的多模态模型探索了道路,并为其他模型树立了新的基准。
2025-01-14 00:32 by 秘密团伙
去中心化社交网络 Mastodon 宣布将其所有权和控制权转让给一个新非盈利实体。Mastodon 不再受 CEO Eugen Rochko 的控制,这与扎克伯格(Mark Zuckerberg)和马斯克(Elon Musk)等社媒 CEO 施展其权力形成鲜明对比。在短期内,用户不会有任何改变,Mastodon 将继续托管 mastodon.social 和 mastodon.online 两大实例,支持联邦网络。
https://www.theverge.com/2025/1/13/24342603/mastodon-non-profit-ownership-ceo-eugen-rochko
https://blog.joinmastodon.org/2025/01/the-people-should-own-the-town-square/
莫扎特和肖邦将角逐2024最新古典乐作曲(如果剩下的几个月没有其他人比如贝多芬舒伯特巴赫发新歌的话...
A Classical Music Discovery https://www.nytimes.com/2024/10/27/briefing/chopin-lang-lang-classical-music.html?smid=nytcore-android-share
周三,东京地下铁将在东京证券交易所上市,募资总额高达3480亿日元(约23亿美元),成为日本六年来规模最大的IPO。
上市不仅得到了30多家券商的支持,更是日本政府今年1月推出的“日本个人储蓄账户”(NISA)计划后的首个大型IPO。NISA计划允许投资者在特定的账户中投资股票、基金等金融产品,旨在吸引更多民众参与股市投资。
本次IPO备受关注,这是自2016年JR九州铁路公司IPO和一年前日本邮政IPO以来,日本首次对国有企业进行私有化。
东京地下铁的IPO价格为1200日元,预计截至2025年3月的财年股息为每股40日元,收益率为3.3%。
东京地下铁一直在通过推出各种福利吸引散户投资者。10月起除每年3.5%分红外,持有200股以上的,将获得股东优惠乘车证。持有1万股,则可获得东京地铁全线年月票的股东福利券。
有股民计算,单凭股东福利券,约55年就可以收回所有成本,还可终身实现“东京地下铁自由”。
此外,公司还将向股东发放各种优惠票券,如地铁博物馆免费入场券、免费饮品券……三菱日联资产管理公司执行基金经理Hiroaki Tomori估计,这将使股息收益率升至4.9%,这十分具有吸引力。
#公共事业 #地铁 #IPO