Weekly Digest
Tuần này chứng kiến sự bùng nổ của hệ sinh thái AI agent và multi-agent orchestration, với các framework như Hermes Agent, oh-my-claudecode, và Superpowers đều hướng tới việc biến AI coding assistant thành hệ thống tự chủ hoàn chỉnh. Claude Code trở thành nền tảng trung tâm mà cộng đồng xây dựng xung quanh — từ hướng dẫn sử dụng, bộ kỹ năng CLAUDE.md, đến workflow orchestration. Google tiếp tục đẩy mạnh AI on-device với AI Edge Gallery và mô hình TimesFM, trong khi NVIDIA mở rộng sang AI đàm thoại real-time. Xu hướng nổi bật nhất là sự dịch chuyển từ 'AI trợ lý' sang 'AI tự vận hành' với vòng lặp học tập và cải thiện liên tục.
Trending Repositories
forrestchang/andrej-karpathy-skills
TheCraigHewitt/seomachine
A specialized Claude Code workspace for creating long-form, SEO-optimized blog content for any business. This system helps you research, write, analyze, and optimize content that ranks well and serves your target audience.
google-ai-edge/gallery
A gallery that showcases on-device ML/GenAI use cases and allows people to try and use models locally.
NVIDIA/personaplex
PersonaPlex code.
google-ai-edge/LiteRT-LM
elebumm/RedditVideoMakerBot
Create Reddit Videos with just✨ one command ✨
obra/superpowers
An agentic skills framework & software development methodology that works.
newton-physics/newton
An open-source, GPU-accelerated physics simulation engine built upon NVIDIA Warp, specifically targeting roboticists and simulation researchers.
abhigyanpatwari/GitNexus
GitNexus: The Zero-Server Code Intelligence Engine - GitNexus is a client-side knowledge graph creator that runs entirely in your browser. Drop in a GitHub repo or ZIP file, and get an interactive knowledge graph wit a built in Graph RAG Agent. Perfect for code exploration
virattt/ai-hedge-fund
An AI Hedge Fund Team
goharbor/harbor
An open source trusted cloud native registry project that stores, signs, and scans content.
Tech Trends
AI Agent tự cải thiện và Multi-Agent Orchestration
Các framework cho phép AI agent hoạt động tự chủ, tự học từ kết quả, và phối hợp nhiều agent theo mô hình team-based đang trở thành trọng tâm phát triển.
-Hermes Agent có vòng lặp học tập tích hợp, tự động cải thiện qua các lần chạy
-oh-my-claudecode xây dựng multi-agent orchestration theo mô hình Teams-first
Claude Code trở thành nền tảng phát triển mở rộng
Cộng đồng đang xây dựng hệ sinh thái phong phú xung quanh Claude Code — từ hướng dẫn chuyên sâu, bộ kỹ năng tùy chỉnh, đến các workspace chuyên biệt và framework orchestration.
-claude-howto: hướng dẫn toàn diện từ cơ bản đến multi-agent
-andrej-karpathy-skills: CLAUDE.md cải thiện hành vi coding dựa trên quan sát thực tế
AI on-device và Edge Computing
Xu hướng chạy mô hình AI trực tiếp trên thiết bị di động và edge, giảm phụ thuộc vào cloud, tăng tốc độ phản hồi và bảo mật dữ liệu.
-Google AI Edge Gallery cho phép chạy LLM mã nguồn mở trực tiếp trên thiết bị
-NVIDIA PersonaPlex hỗ trợ đàm thoại speech-to-speech real-time full-duplex
Client-side AI Analysis và Knowledge Graphs
Các công cụ phân tích thông minh hoạt động hoàn toàn phía client, xây dựng knowledge graph từ codebase mà không cần gửi mã nguồn lên server.
-GitNexus xây dựng knowledge graph từ codebase hoàn toàn phía client
-Onyx cung cấp AI Chat hoạt động với mọi LLM
AI tự động hóa sáng tạo nội dung
Bot và workspace chuyên biệt tự động tạo nội dung video, blog SEO từ nguồn dữ liệu có sẵn, giảm thiểu công sức thủ công.
-RedditVideoMakerBot tự động tạo video TikTok/Shorts từ bài Reddit
-SEO Machine tạo nội dung blog dài tối ưu SEO tự động
Featured Topics
Python
661,890 reposPython là ngôn ngữ lập trình kiểu động, garbage-collected, được phát triển bởi Guido van Rossum vào cuối thập niên 80. Có thư viện phong phú từ web dev đến nghiên cứu khoa học.
JavaScript
642,431 reposJavaScript (JS) là ngôn ngữ lập trình nhẹ, thông dịch hoặc JIT-compiled với first-class functions. Hỗ trợ lập trình hướng đối tượng, mệnh lệnh và hàm.
React
455,155 reposReact (React.js/ReactJS) là thư viện JavaScript giúp xây dựng giao diện tương tác đơn giản. Được tạo bởi Jordan Walke, ra mắt tháng 3/2013.
CSS
371,954 reposCascading Style Sheets (CSS) là ngôn ngữ dùng để tạo kiểu và cải thiện giao diện website. Cho phép tách biệt trình bày khỏi nội dung.
TypeScript
326,906 reposTypeScript là ngôn ngữ mã nguồn mở do Microsoft phát triển, ra mắt 2012. Thêm type safety cho JavaScript, tuân thủ chuẩn ECMAScript.
Node.js
310,559 reposNode.js là công cụ thực thi JavaScript trong nhiều môi trường khác nhau. Cho phép tạo server, CLI tools, ứng dụng desktop và robotics.
Machine Learning
190,684 reposMachine learning là thực hành dạy máy tính học. Sử dụng nhận dạng mẫu và thuật toán dự đoán để phán đoán dữ liệu đầu vào. Liên quan chặt chẽ đến AI và thống kê tính toán.
React Native
56,890 reposReact Native là framework mobile JavaScript do Facebook phát triển. Cho phép xây dựng app Android và iOS bằng JavaScript, tái sử dụng code giữa web và mobile.
Curated Collections
Machine Learning
20 reposHọc máy — nghiên cứu các thuật toán đưa ra dự đoán dựa trên dữ liệu — đã tìm thấy đối tượng mới và tập hợp khả năng mới.
Front-end JavaScript Frameworks
21 reposCác công cụ xây dựng ứng dụng Single-Page với JavaScript có tổ chức.
DevOps Tools
20 reposCác công cụ giúp quản lý server và triển khai ứng dụng thường xuyên hơn, vui hơn và tự tin hơn.
Productivity Tools
20 reposXây dựng phần mềm nhanh hơn với ít đau đầu hơn, sử dụng các công cụ và mẹo này.
Learn to Code
20 reposTài nguyên giúp mọi người học lập trình.
Clean Code Linters
21 reposĐảm bảo code tuân theo style guide với các công cụ lint thiết yếu.
Design Essentials
22 reposBộ sưu tập thư viện thiết kế tốt nhất trên web, hoàn thiện bộ công cụ cho sản phẩm đẹp.
Government Apps
19 reposCác trang web, ứng dụng và công cụ do chính phủ xây dựng để hoạt động hiệu quả hơn.
Notable Releases
google/gemmaGemma 4
- -Đầu tiên dùng Apache 2.0 license (OSI-approved)
- -4 phiên bản: E2B, E4B, 26B MoE, 31B Dense
- -Hỗ trợ agentic workflows và complex logic
QwenLM/Qwen3.6-PlusQwen 3.6 Plus
- -Context window 1M tokens
- -Hiệu suất agentic coding cạnh tranh với Claude 4.5 Opus
- -Nâng cấp đa phương thức (multimodal)
openai/gpt-oss-120bgpt-oss-120b
- -OpenAI phát hành mô hình open-weight đầu tiên 120B tham số
- -Cạnh tranh trên nhiều benchmarks với mô hình thương mại
mistralai/Mistral-Small-4Mistral Small 4
- -Mô hình nhỏ gọn cạnh tranh với các mô hình thương mại
- -Tối ưu cho agentic workflows
Events
PyTorch Conference Europe
Hội nghị PyTorch châu Âu, tập trung vào deep learning và AI open-source
MCP Dev Summit North America
Hội nghị dành cho nhà phát triển MCP (Model Context Protocol)
Open Community Experience (OCX)
Hội nghị Eclipse Foundation về quản lý cộng đồng, governance và hợp tác open-source
LinuxFest Northwest
Hội nghị Linux và Open Source do tình nguyện viên tổ chức, cộng đồng grassroots
Open Tech Day: Software-defined Storage
Sự kiện về lưu trữ phần mềm định nghĩa (SDS) open-source
Predictions
Multi-agent orchestration sẽ trở thành tính năng built-in của các AI coding assistant lớn, không còn cần framework bên thứ ba
Số lượng lớn các wrapper và orchestration framework (oh-my-claudecode, oh-my-codex, Superpowers) cho thấy nhu cầu rõ ràng mà các nền tảng gốc sẽ phải tích hợp
CLAUDE.md và system prompt engineering sẽ trở thành một kỹ năng chuyên môn được công nhận trong ngành
Sự xuất hiện của các bộ kỹ năng chuyên biệt (andrej-karpathy-skills, SEO Machine) và hướng dẫn chuyên sâu cho thấy prompt engineering đang chuyên môn hóa theo từng domain
On-device LLM sẽ đạt chất lượng đủ tốt cho các tác vụ phổ thông, tạo ra làn sóng ứng dụng AI offline-first
Google và NVIDIA đồng thời đẩy mạnh AI edge/on-device, kết hợp với phần cứng mobile ngày càng mạnh
Self-improving AI agents sẽ được ứng dụng rộng rãi trong CI/CD và DevOps tự động
Hermes Agent với vòng lặp tự học là prototype đầu tiên — khi ổn định hơn, việc tích hợp vào pipeline sẽ là bước tự nhiên
Repos to Watch
NousResearch/hermes-agent
Tiên phong trong self-improving AI agent — nếu vòng lặp học tập hoạt động tốt, đây sẽ là mô hình chuẩn cho thế hệ agent tiếp theo
Yeachan-Heo/oh-my-claudecode
Multi-agent orchestration cho Claude Code đang rất hot, giải quyết nhu cầu thực tế của developer
google-ai-edge/gallery
Google đang đặt cược lớn vào on-device AI — repo này cho thấy hướng đi sản phẩm rõ ràng
abhigyanpatwari/GitNexus
Knowledge graph từ codebase chạy client-side là ý tưởng độc đáo, tiềm năng lớn cho code understanding
NVIDIA/personaplex
Speech-to-speech real-time full-duplex mở ra khả năng xây dựng AI assistant tương tác tự nhiên hơn
Topics to Learn
Deep Analysis
(19 repos)NousResearch/hermes-agent
Hermes Agent là một AI agent tự cải thiện do Nous Research phát triển, nổi bật với vòng lặp học tập tích hợp — tự động tạo kỹ năng từ kinh nghiệm, cải thiện chúng trong quá trình sử dụng, và xây dựng mô hình người dùng sâu dần qua các phiên làm việc. Agent hỗ trợ đa nền tảng (Telegram, Discord, Slack, WhatsApp, Signal, CLI) thông qua một gateway duy nhất, với hệ thống bộ nhớ bền vững và tìm kiếm toàn văn FTS5 kết hợp tóm tắt LLM. Hỗ trợ hơn 40 công cụ tích hợp, 6 backend terminal (local, Docker, SSH, Daytona, Singularity, Modal), và tương thích với nhiều nhà cung cấp LLM như Nous Portal, OpenRouter (200+ model), OpenAI, và các endpoint tùy chỉnh. Dự án còn tích hợp khả năng nghiên cứu RL thông qua Atropos và hỗ trợ giao thức MCP để mở rộng công cụ.
-Hệ thống học tập tự động: tạo kỹ năng mới, cải thiện kỹ năng hiện có, mô hình hóa người dùng theo chuẩn agentskills.io
-Gateway đa nền tảng: Telegram, Discord, Slack, WhatsApp, Signal với phiên trò chuyện liên tục và phiên âm voice memo
-40+ công cụ tích hợp sẵn với khả năng mở rộng qua MCP server và plugin
siddharthvaddem/openscreen
OpenScreen là công cụ quay màn hình và tạo demo miễn phí, mã nguồn mở, được xây dựng như một giải pháp thay thế cho Screen Studio. Ứng dụng desktop được phát triển trên nền tảng Electron với React và TypeScript, hỗ trợ đa nền tảng (macOS, Windows, Linux). Cung cấp các tính năng chuyên nghiệp như hiệu ứng zoom tự động, motion blur, annotation, cắt ghép video và xuất đa định dạng — hoàn toàn miễn phí, không watermark, không subscription, và cho phép sử dụng thương mại theo giấy phép MIT.
-Hiệu ứng zoom tự động/thủ công với độ sâu tùy chỉnh
-Motion blur mượt mà cho chuyển cảnh
-Công cụ annotation: text, mũi tên, hình ảnh
Yeachan-Heo/oh-my-codex
OmX (Oh My codeX) là một lớp điều phối workflow được xây dựng trên nền OpenAI Codex CLI, giúp nâng cao trải nghiệm phát triển bằng cách cung cấp khả năng định tuyến tác vụ có cấu trúc, quản lý trạng thái bền vững và thực thi agent phối hợp. Dự án không thay thế Codex mà mở rộng nó với các kỹ năng (skills) có thể tái sử dụng, cơ sở hạ tầng runtime đa agent, và hệ thống hook tích hợp gốc. Trạng thái dự án được duy trì trong thư mục `.omx/` với kế hoạch, nhật ký và bộ nhớ phiên làm việc. OmX hỗ trợ thực thi song song nhiều agent thông qua tmux và cung cấp CLI tương tác để giám sát, khám phá mã nguồn.
-4 skill workflow chính: $deep-interview, $ralplan, $team, $ralph — từ làm rõ yêu cầu đến hoàn thành tác vụ
-Quản lý trạng thái bền vững trong thư mục .omx/ với kế hoạch, nhật ký và bộ nhớ
-Thực thi đa agent song song với phân vai trò (ví dụ: 3:executor) và giám sát qua HUD
luongnv89/claude-howto
Một hướng dẫn toàn diện, có cấu trúc để thành thạo Claude Code — từ khái niệm cơ bản đến hệ thống đa agent nâng cao. Repo cung cấp các tutorial trực quan với sơ đồ Mermaid, template sẵn sàng cho production có thể copy-paste ngay, và lộ trình học tập 11-13 giờ được thiết kế bài bản. Hỗ trợ đa ngôn ngữ (Tiếng Anh, Tiếng Việt, Tiếng Trung) và được cập nhật đồng bộ với các phiên bản Claude Code mới nhất. Với hơn 23.4k stars, đây là tài liệu tham khảo phổ biến nhất cho cộng đồng người dùng Claude Code.
-Lộ trình học tập có cấu trúc 11-13 giờ từ beginner đến advanced
-Template copy-paste sẵn sàng cho production, áp dụng ngay vào dự án
-Sơ đồ trực quan (Mermaid diagrams) giải thích cơ chế hoạt động nội bộ
Yeachan-Heo/oh-my-claudecode
oh-my-claudecode (OMC) là framework điều phối đa tác tử (multi-agent orchestration) theo mô hình Teams-first dành cho Claude Code, cho phép nhiều AI agent phối hợp làm việc theo pipeline có giai đoạn (plan → PRD → exec → verify → fix). Framework hỗ trợ nhiều chế độ điều phối như Team, Autopilot, Ralph (vòng lặp verify/fix liên tục), Ultrawork (song song tối đa), và Deep Interview (làm rõ yêu cầu kiểu Socratic). OMC tích hợp đa nhà cung cấp AI (Claude, Codex, Gemini) với định tuyến mô hình thông minh giúp tiết kiệm 30-50% token, đồng thời có hệ thống 19 agent chuyên biệt tự động phân công nhiệm vụ theo lĩnh vực và độ phức tạp. Điểm nổi bật là triết lý zero learning curve — người dùng chỉ cần dùng ngôn ngữ tự nhiên thay vì phải nhớ cú pháp lệnh.
-Team Orchestration: điều phối đa agent theo pipeline có giai đoạn, hỗ trợ cả in-session (/team) và CLI (omc team) với tmux workers
-6 chế độ điều phối: Team, Autopilot, Ralph, Ultrawork, Pipeline, Deep Interview — phù hợp từ tác vụ đơn giản đến phức tạp
-Đa nhà cung cấp AI: tích hợp Claude, Codex, Gemini với khả năng truy vấn và tổng hợp kết quả chéo nhà cung cấp
onyx-dot-app/onyx
Open Source AI Platform - AI Chat with advanced features that works with every LLM
sherlock-project/sherlock
Sherlock là công cụ dòng lệnh (CLI) mã nguồn mở giúp truy tìm tài khoản mạng xã hội theo tên người dùng trên hơn 400 mạng xã hội khác nhau. Được viết bằng Python, công cụ hỗ trợ nhiều phương thức cài đặt như pip, Docker, Homebrew và các trình quản lý gói Linux. Sherlock cho phép xuất kết quả dưới nhiều định dạng (TXT, CSV, XLSX, JSON) và hỗ trợ tìm kiếm ẩn danh qua Tor/Proxy. Với hơn 80.000 sao trên GitHub, đây là một trong những công cụ OSINT phổ biến nhất trong cộng đồng an ninh mạng.
-Tìm kiếm tài khoản theo username trên 400+ mạng xã hội cùng lúc
-Hỗ trợ tìm kiếm nhiều username đồng thời trong một lần chạy
-Xuất kết quả đa định dạng: TXT, CSV, XLSX, JSON
google-research/timesfm
TimesFM là mô hình nền tảng chuỗi thời gian (Time Series Foundation Model) được Google Research phát triển, sử dụng kiến trúc transformer decoder-only để dự báo chuỗi thời gian. Phiên bản 2.5 giảm tham số từ 500M xuống 200M nhưng mở rộng cửa sổ ngữ cảnh lên 16.000 bước thời gian, hỗ trợ dự báo xác suất qua quantile head 30M tham số. Mô hình hỗ trợ nhiều backend (PyTorch, JAX/Flax) và chạy trên CPU, GPU, TPU, Apple Silicon, đồng thời tích hợp sẵn trong Google BigQuery.
-Dự báo chuỗi thời gian pretrained sẵn, không cần huấn luyện lại
-Dự báo xác suất liên tục với quantile từ 10% đến 90%
-Tích hợp Hugging Face qua from_pretrained() và Google BigQuery
obra/superpowers
Superpowers là một framework kỹ năng tác tử (agentic skills) và phương pháp phát triển phần mềm hoàn chỉnh, được thiết kế để nâng cao năng lực của các trợ lý lập trình AI như Claude Code, Cursor, Gemini CLI và Codex. Framework cung cấp quy trình làm việc có cấu trúc từ giai đoạn thiết kế, lên kế hoạch, triển khai tự động đến kiểm thử và review code. Hệ thống hoạt động dựa trên kiến trúc kỹ năng (skills) có thể kết hợp, trong đó mỗi skill đại diện cho một thành phần quy trình riêng biệt được kích hoạt tự động theo trình tự phát triển. Với hơn 141K stars trên GitHub, đây là một trong những dự án open-source nổi bật nhất trong lĩnh vực AI-assisted development.
-Quy trình thiết kế tương tác (brainstorming) với khả năng đặt câu hỏi phản biện trước khi viết code
-Tạo specification và chia nhỏ thành các phần dễ kiểm tra cho con người xác nhận
-Lập kế hoạch triển khai chia nhỏ task thành các đơn vị 2-5 phút với đường dẫn file cụ thể và bước xác minh
abhigyanpatwari/GitNexus
GitNexus là một công cụ phân tích mã nguồn thông minh hoạt động hoàn toàn phía client, xây dựng knowledge graph từ codebase bằng Tree-sitter và thuật toán phát hiện cộng đồng Leiden. Hệ thống cung cấp hai chế độ sử dụng: CLI kết hợp MCP server để tích hợp trực tiếp với các AI agent (Claude Code, Cursor, Codex), và giao diện Web chạy trên trình duyệt qua WebAssembly không cần cài đặt. Công cụ tiền xử lý quan hệ code tại thời điểm index — bao gồm clustering, tracing luồng thực thi, và tính điểm confidence — giúp AI agent nhận được ngữ cảnh đầy đủ chỉ trong một lần gọi. Hỗ trợ phân tích đa repository cho kiến trúc monorepo và microservices, đồng thời đảm bảo quyền riêng tư vì toàn bộ xử lý diễn ra cục bộ.
-Hybrid search kết hợp BM25, semantic matching và reciprocal rank fusion để tìm kiếm code chính xác
-Impact analysis với blast radius scoring và git-diff detection ánh xạ dòng thay đổi đến các process bị ảnh hưởng
-11 MCP tools per-repo và 5 group-level tools cho AI agent — bao gồm query, context, impact, rename, cypher
google-ai-edge/gallery
Google AI Edge Gallery là ứng dụng di động cho phép chạy các mô hình ngôn ngữ lớn (LLM) mã nguồn mở trực tiếp trên thiết bị, hoàn toàn offline, riêng tư và nhanh chóng. Ứng dụng hỗ trợ trò chuyện AI đa lượt với chế độ Thinking Mode, khả năng đa phương thức (hỏi đáp hình ảnh, chuyển đổi giọng nói), và hệ thống Agent Skills mở rộng. Được xây dựng trên nền tảng Google AI Edge và LiteRT, tích hợp Hugging Face để tải mô hình, hỗ trợ cả Android 12+ và iOS 17+. Dự án tập trung vào việc trình diễn và cho phép người dùng trải nghiệm ML/GenAI on-device với mô hình Gemma 4 làm trung tâm.
-AI Chat với Thinking Mode hiển thị quá trình suy luận từng bước của mô hình
-Đa phương thức: Ask Image (phân tích hình ảnh) và Audio Scribe (chuyển đổi giọng nói thời gian thực)
-Agent Skills mở rộng với hệ sinh thái cộng đồng qua GitHub Discussions
forrestchang/andrej-karpathy-skills
Bộ hướng dẫn (CLAUDE.md) giúp cải thiện hành vi viết code của Claude Code, dựa trên các quan sát của Andrej Karpathy về những sai lầm phổ biến khi LLM lập trình. Dự án cung cấp 4 nguyên tắc cốt lõi: Suy nghĩ trước khi code, Đơn giản trước, Thay đổi chính xác, và Thực thi hướng mục tiêu. Có thể cài đặt dưới dạng plugin Claude Code hoặc thêm trực tiếp file CLAUDE.md vào dự án. Với hơn 9.000 stars, đây là một trong những bộ skill được cộng đồng đón nhận rộng rãi nhất cho Claude Code.
-Think Before Coding — yêu cầu LLM đọc hiểu code hiện tại trước khi viết, tránh giả định sai
-Simplicity First — ưu tiên giải pháp đơn giản, tránh code phình to (1000 dòng khi 100 dòng đủ)
-Surgical Changes — chỉ thay đổi đúng phần cần thiết, không refactor hay cải thiện lan man
TheCraigHewitt/seomachine
SEO Machine là một workspace chuyên biệt cho Claude Code, được thiết kế để tạo nội dung blog dài, tối ưu hóa SEO cho bất kỳ doanh nghiệp nào. Hệ thống kết hợp AI với tích hợp phân tích dữ liệu từ Google Analytics 4, Google Search Console và DataForSEO để nghiên cứu, viết, phân tích và tối ưu hóa nội dung. Với 10 agent chuyên biệt, 15+ slash command và 26 kỹ năng marketing tích hợp, nó cung cấp quy trình hoàn chỉnh từ nghiên cứu từ khóa đến xuất bản bài viết 2000-3000+ từ lên WordPress.
-15+ slash command tùy chỉnh (/research, /write, /rewrite, /optimize, /publish-draft...)
-10 agent chuyên biệt tự động phân tích và tối ưu nội dung từ nhiều góc độ
-26 kỹ năng marketing tích hợp (copywriting, CRO, email, social, paid ads, SEO audit)
NVIDIA/personaplex
PersonaPlex là mô hình AI đàm thoại speech-to-speech thời gian thực, full-duplex do NVIDIA phát triển, cho phép kiểm soát persona thông qua text prompt và voice conditioning. Được xây dựng trên kiến trúc Moshi với LLM Helium làm backbone, mô hình kết hợp dữ liệu huấn luyện tổng hợp và hội thoại thực để tạo ra tương tác thoại tự nhiên với độ trễ thấp. Hỗ trợ 16 giọng nói đóng gói sẵn, triển khai qua Web UI, Docker, và chế độ đánh giá offline.
-Đàm thoại speech-to-speech thời gian thực, full-duplex
-Kiểm soát persona qua text prompt và audio voice conditioning
-16 giọng nói đóng gói sẵn (Natural và Variety) đa dạng giới tính
elebumm/RedditVideoMakerBot
Bot tự động tạo video dạng TikTok/YouTube Shorts/Instagram Reels từ các bài đăng Reddit chỉ với một lệnh duy nhất. Bot sử dụng PRAW để lấy bài viết và bình luận từ Reddit, Playwright để chụp ảnh màn hình giao diện Reddit, hỗ trợ 7 engine chuyển văn bản thành giọng nói (TTS) bao gồm Google Translate, TikTok, AWS Polly, ElevenLabs, OpenAI và pyttsx3. Video được ghép nối bằng FFmpeg với video nền tải từ YouTube qua yt-dlp, có hỗ trợ nhạc nền, tạo thumbnail tự động và xuất file MP4 hoàn chỉnh vào thư mục results.
-Tạo video Reddit tự động end-to-end chỉ với một lệnh duy nhất
-Hỗ trợ 7 engine chuyển văn bản thành giọng nói (TTS) với nhiều giọng đọc khác nhau
-Chế độ story mode để tạo video từ bài viết dài thay vì bình luận
google-ai-edge/LiteRT-LM
LiteRT-LM là framework suy luận (inference) cấp production của Google, được thiết kế để triển khai các Mô hình Ngôn ngữ Lớn (LLM) trên thiết bị biên (edge devices). Framework này đang được sử dụng thực tế trong các sản phẩm tiêu dùng của Google như Chrome, Chromebook Plus và Pixel Watch. Hỗ trợ đa nền tảng bao gồm Android, iOS, Web, Desktop và IoT (Raspberry Pi), đồng thời tối ưu hóa tăng tốc phần cứng GPU và NPU. Tương thích với nhiều mô hình phổ biến như Gemma, Llama, Phi-4, Qwen và hỗ trợ đa phương thức (vision, audio) cùng function calling cho các workflow AI tự động.
-Hỗ trợ đa nền tảng: Android, iOS, Web, Desktop và IoT (Raspberry Pi)
-Tương thích nhiều mô hình LLM phổ biến: Gemma, Llama, Phi-4, Qwen
-Hỗ trợ đa phương thức (multi-modality): đầu vào vision và audio
virattt/ai-hedge-fund
An AI Hedge Fund Team
newton-physics/newton
Newton là engine mô phỏng vật lý mã nguồn mở, tăng tốc bằng GPU, được xây dựng trên nền tảng NVIDIA Warp với MuJoCo Warp làm backend chính. Dự án được khởi xướng bởi Disney Research, Google DeepMind và NVIDIA, hoạt động dưới Linux Foundation. Engine hỗ trợ mô phỏng đa vật lý bao gồm động lực học vật rắn, vật thể biến dạng (dây cáp, vải, vật mềm), vật liệu hạt (MPM), và mô phỏng khả vi (differentiable simulation). Được thiết kế đặc biệt cho các nhà nghiên cứu robot và mô phỏng, với hơn 60 ví dụ thực thi từ con lắc đơn giản đến robot hình người và tay máy công nghiệp.
-Mô phỏng đa vật lý: động lực học vật rắn, vật biến dạng (dây, vải, vật mềm), vật liệu hạt (MPM)
-Mô phỏng khả vi (differentiable simulation) cho tối ưu hóa dựa trên gradient
-Hệ thống cảm biến tích hợp: camera, IMU, cảm biến tiếp xúc
goharbor/harbor
Harbor là một registry cloud native mã nguồn mở được CNCF quản lý, dùng để lưu trữ, ký xác thực và quét lỗ hổng bảo mật cho container image và Helm chart. Dự án mở rộng Docker Distribution bằng cách bổ sung các tính năng doanh nghiệp như kiểm soát truy cập theo vai trò (RBAC), sao chép image giữa các registry theo chính sách, và tích hợp xác thực LDAP/AD/OIDC. Harbor hỗ trợ triển khai đa môi trường thông qua Docker Compose, Helm chart và Operator, phù hợp cho các hệ thống hybrid/multi-cloud quy mô lớn. Với hơn 28.000 stars trên GitHub và giấy phép Apache 2.0, đây là một trong những registry phổ biến nhất trong hệ sinh thái cloud native.
-Kiểm soát truy cập theo vai trò (RBAC) dựa trên project với tích hợp LDAP/AD/OIDC
-Sao chép image và chart giữa các registry theo chính sách tự động
-Quét lỗ hổng bảo mật với chính sách ngăn chặn triển khai image có lỗ hổng