Danh mục kỹ năng đi kèm

Hermes cung cấp một thư viện kỹ năng tích hợp lớn được sao chép vào ~/.hermes/skills/ khi cài đặt. Trang này liệt kê các kỹ năng đi kèm có trong kho dưới mục skills/.

quả táo

Các kỹ năng dành riêng cho Apple/macOS - tự động hóa iMessage, Lời nhắc, Ghi chú, FindMy và macOS. Những kỹ năng này chỉ tải trên hệ thống macOS.

Kỹ năng	Mô tả	Đường dẫn
`ghi chú táo`	Quản lý Apple Notes thông qua bản ghi nhớ CLI trên macOS (tạo, xem, tìm kiếm, chỉnh sửa).	`táo/táo-ghi chú`
`táo-nhắc nhở`	Quản lý Lời nhắc của Apple thông qua Remindctl CLI (liệt kê, thêm, hoàn thành, xóa).	`apple/apple-nhắc nhở`
`tìm tôi`	Theo dõi các thiết bị Apple và AirTags thông qua FindMy.app trên macOS bằng AppleScript và chụp ảnh màn hình.	`táo/tìmmy`
`tin nhắn`	Gửi và nhận iMessages/SMS qua imsg CLI trên macOS.	`táo/imessage`

tác nhân ai tự trị

Kỹ năng tạo ra và điều phối các tác nhân mã hóa AI tự động và quy trình làm việc của nhiều tác nhân - chạy các quy trình tác nhân độc lập, phân công nhiệm vụ và điều phối các luồng công việc song song.

Kỹ năng	Mô tả	Đường dẫn
`mã claude`	Giao nhiệm vụ mã hóa cho Claude Code (đại diện CLI của Anthropic). Sử dụng để xây dựng các tính năng, tái cấu trúc, đánh giá PR và mã hóa lặp lại. Yêu cầu claude CLI được cài đặt.	`tác nhân-ai-tự trị/claude-code`
`codex`	Ủy quyền các nhiệm vụ mã hóa cho tác nhân OpenAI Codex CLI. Sử dụng để xây dựng các tính năng, tái cấu trúc, đánh giá PR và sửa lỗi hàng loạt. Yêu cầu codex CLI và kho lưu trữ git.	`tác nhân-ai-tự trị/codex`
`hermes-đại lý-sinh sản`	Tạo ra các phiên bản Đại lý Hermes bổ sung dưới dạng các quy trình con tự động cho các tác vụ dài hạn độc lập. Hỗ trợ chế độ một lần không tương tác (-q) và chế độ PTY tương tác để cộng tác nhiều lượt. Khác với delegate_task — thao tác này chạy một quy trình Hermes hoàn toàn riêng biệt.	`tác nhân-ai-tự trị/tác nhân-hermes`
`mã mở`	Ủy quyền các nhiệm vụ mã hóa cho tác nhân OpenCode CLI để triển khai tính năng, tái cấu trúc, đánh giá PR và các phiên tự trị kéo dài. Yêu cầu cài đặt và xác thực mã mở CLI.	`tác nhân-ai-tự trị/opencode`

khoa học dữ liệu

Kỹ năng dành cho quy trình làm việc của khoa học dữ liệu - khám phá tương tác, sổ ghi chép Jupyter, phân tích dữ liệu và trực quan hóa.

Kỹ năng	Mô tả	Đường dẫn
`jupyter-live-kernel`	Sử dụng nhân Jupyter trực tiếp để thực thi Python lặp lại, có trạng thái thông qua hamelnb. Tải kỹ năng này khi nhiệm vụ liên quan đến việc khám phá, lặp lại hoặc kiểm tra các kết quả trung gian.	`khoa học dữ liệu/jupyter-live-kernel`

sáng tạo

Tạo nội dung sáng tạo - nghệ thuật ASCII, sơ đồ kiểu vẽ tay và các công cụ thiết kế trực quan.

Kỹ năng	Mô tả	Đường dẫn
`ascii-nghệ thuật`	Tạo tác phẩm nghệ thuật ASCII bằng cách sử dụng pyfiglet (571 phông chữ), cowsay, hộp, toilet, image-to-ascii, API từ xa (asciified, ascii.co.uk) và dự phòng LLM. Không cần khóa API.	`sáng tạo/ascii-nghệ thuật`
`ascii-video`	"Quy trình sản xuất video nghệ thuật ASCII — bất kỳ định dạng nào. Chuyển đổi video/âm thanh/hình ảnh/đầu vào tổng hợp thành đầu ra video ký tự ASCII màu (MP4, GIF, chuỗi hình ảnh). Bao gồm: chuyển đổi video sang ASCII, trình hiển thị nhạc phản ứng âm thanh, hoạt hình nghệ thuật ASCII tổng quát, kết hợp…	`sáng tạo/ascii-video`
`excalidraw`	Tạo sơ đồ kiểu vẽ tay bằng định dạng Excalidraw JSON. Tạo tệp .excalidraw cho sơ đồ kiến trúc, sơ đồ, sơ đồ trình tự, bản đồ khái niệm, v.v. Các tập tin có thể được mở tại excalidraw.com hoặc tải lên để có các liên kết có thể chia sẻ.	`sáng tạo/excalidraw`
`p5js`	Quy trình sản xuất nghệ thuật thị giác mang tính tương tác và sáng tạo bằng cách sử dụng p5.js. Tạo bản phác thảo, hiển thị chúng thành hình ảnh/video thông qua trình duyệt không có giao diện người dùng và cung cấp bản xem trước trực tiếp. Hỗ trợ hoạt ảnh canvas, trực quan hóa dữ liệu và thử nghiệm mã hóa sáng tạo.	`sáng tạo/p5js`

nhà phát triển

DevOps và kỹ năng tự động hóa cơ sở hạ tầng.

Kỹ năng	Mô tả	Đường dẫn
`đăng ký webhook`	Tạo và quản lý đăng ký webhook để kích hoạt tổng đài viên theo sự kiện. Sự kiện POST của các dịch vụ bên ngoài (GitHub, Stripe, CI/CD, IoT) để kích hoạt hoạt động của tác nhân. Yêu cầu bật nền tảng webhook.	`devops/webhook-đăng ký`

##thức ăn cho chó

Kỹ năng	Mô tả	Đường dẫn
`thức ăn cho chó`	Kiểm tra QA khám phá có hệ thống các ứng dụng web - tìm lỗi, thu thập bằng chứng và tạo báo cáo có cấu trúc.	`thức ăn cho chó/thức ăn cho chó`
`hermes-agent-setup`	Giúp người dùng định cấu hình Tác nhân Hermes — cách sử dụng CLI, trình hướng dẫn thiết lập, lựa chọn kiểu máy/nhà cung cấp, công cụ, kỹ năng, giọng nói/STT/TTS, cổng và khắc phục sự cố.	`dogfood/hermes-agent-setup`

email

Kỹ năng gửi, nhận, tìm kiếm và quản lý email từ thiết bị đầu cuối.

Kỹ năng	Mô tả	Đường dẫn
`himalaya`	CLI để quản lý email qua IMAP/SMTP. Sử dụng Himalaya để liệt kê, đọc, viết, trả lời, chuyển tiếp, tìm kiếm và sắp xếp email từ thiết bị đầu cuối. Hỗ trợ nhiều tài khoản và soạn tin nhắn với MML (Ngôn ngữ meta MIME).	`email/himalaya`

chơi game

Kỹ năng thiết lập, định cấu hình và quản lý máy chủ trò chơi, gói mod và cơ sở hạ tầng liên quan đến trò chơi.

Kỹ năng	Mô tả	Đường dẫn
`minecraft-modpack-server`	Thiết lập máy chủ Minecraft đã được sửa đổi từ gói zip máy chủ CurseForge/Modrinth. Bao gồm cài đặt NeoForge/Forge, phiên bản Java, điều chỉnh JVM, tường lửa, cấu hình mạng LAN, bản sao lưu và tập lệnh khởi chạy.	`chơi game/minecraft-modpack-server`
`người chơi pokemon`	Chơi trò chơi Pokemon một cách tự động thông qua mô phỏng không cần đầu. Khởi động máy chủ trò chơi, đọc trạng thái trò chơi có cấu trúc từ RAM, đưa ra quyết định chiến lược và gửi đầu vào nút — tất cả đều từ thiết bị đầu cuối.	`chơi game/người chơi pokemon`

##github

Kỹ năng xử lý công việc của GitHub để quản lý kho lưu trữ, yêu cầu kéo, đánh giá mã, sự cố và quy trình CI/CD bằng cách sử dụng gh CLI và git qua thiết bị đầu cuối.

Kỹ năng	Mô tả	Đường dẫn
`kiểm tra cơ sở mã`	Kiểm tra và phân tích cơ sở mã bằng cách sử dụng pygount để đếm LỘC, phân tích ngôn ngữ và tỷ lệ mã so với nhận xét. Sử dụng khi được yêu cầu kiểm tra các dòng mã, kích thước kho lưu trữ, thành phần ngôn ngữ hoặc số liệu thống kê về cơ sở mã.	`github/codebase-kiểm tra`
`github-auth`	Thiết lập xác thực GitHub cho tác nhân bằng git (có sẵn phổ biến) hoặc gh CLI. Bao gồm mã thông báo HTTPS, khóa SSH, trình trợ giúp thông tin xác thực và gh auth — với quy trình phát hiện để tự động chọn phương thức phù hợp.	`github/github-auth`
`github-code-review`	Xem xét các thay đổi mã bằng cách phân tích các điểm khác biệt của git, để lại nhận xét nội tuyến về PR và thực hiện đánh giá kỹ lưỡng trước khi đẩy. Hoạt động với gh CLI hoặc quay lại API git + GitHub REST thông qua cuộn tròn.	`github/github-code-review`
`github-vấn đề`	Tạo, quản lý, phân loại và đóng các sự cố GitHub. Tìm kiếm các vấn đề hiện có, thêm nhãn, chỉ định người và liên kết tới PR. Hoạt động với gh CLI hoặc quay lại API git + GitHub REST thông qua cuộn tròn.	`github/github-issues`
`github-pr-workflow`	Vòng đời yêu cầu kéo đầy đủ - tạo nhánh, cam kết thay đổi, mở PR, theo dõi trạng thái CI, tự động sửa lỗi và hợp nhất. Hoạt động với gh CLI hoặc quay lại API git + GitHub REST thông qua cuộn tròn.	`github/github-pr-workflow`
`github-repo-quản lý`	Sao chép, tạo, phân nhánh, định cấu hình và quản lý kho lưu trữ GitHub. Quản lý điều khiển từ xa, bí mật, bản phát hành và quy trình làm việc. Hoạt động với gh CLI hoặc quay lại API git + GitHub REST thông qua cuộn tròn.	`github/github-repo-quản lý`

suy luận-sh

Kỹ năng thực thi ứng dụng AI thông qua nền tảng đám mây suy luận.sh.

Kỹ năng	Mô tả	Đường dẫn
`suy luận-sh-cli`	Chạy hơn 150 ứng dụng AI thông qua inference.sh CLI (infsh) - tạo hình ảnh, tạo video, LLM, tìm kiếm, 3D, tự động hóa xã hội.	`suy luận-sh/cli`

thời gian rảnh rỗi

Kỹ năng	Mô tả	Đường dẫn
`tìm-gần`	Tìm các địa điểm lân cận (nhà hàng, quán cà phê, quán bar, hiệu thuốc, v.v.) bằng OpenStreetMap. Hoạt động với tọa độ, địa chỉ, thành phố, mã zip hoặc ghim vị trí của Telegram. Không cần khóa API.	`giải trí/tìm-gần`

##mcp

Kỹ năng làm việc với máy chủ, công cụ và tích hợp MCP (Giao thức bối cảnh mô hình). Bao gồm ứng dụng khách MCP gốc được tích hợp sẵn (cấu hình máy chủ trong config.yaml để khám phá công cụ tự động) và cầu nối CLI của mcporter để tương tác với máy chủ đặc biệt.

Kỹ năng	Mô tả	Đường dẫn
`mcporter`	Sử dụng mcporter CLI để liệt kê, định cấu hình, xác thực và gọi trực tiếp các máy chủ/công cụ MCP (HTTP hoặc stdio), bao gồm máy chủ đặc biệt, chỉnh sửa cấu hình và tạo CLI/loại.	`mcp/mcporter`
`bản địa-mcp`	Máy khách MCP (Giao thức bối cảnh mô hình) tích hợp kết nối với các máy chủ MCP bên ngoài, khám phá các công cụ của chúng và đăng ký chúng dưới dạng công cụ Đại lý Hermes gốc. Hỗ trợ truyền tải stdio và HTTP với khả năng kết nối lại tự động, lọc bảo mật và chèn công cụ không cấu hình.	`mcp/bản địa-mcp`

phương tiện truyền thông

Kỹ năng làm việc với nội dung đa phương tiện - Bản ghi YouTube, tìm kiếm GIF, tạo nhạc và hiển thị âm thanh.

Kỹ năng	Mô tả	Đường dẫn
`tìm kiếm gif`	Tìm kiếm và tải xuống ảnh GIF từ Tenor bằng cách sử dụng tính năng cuộn tròn. Không có sự phụ thuộc nào ngoài Curl và jq. Hữu ích khi tìm ảnh GIF phản ứng, tạo nội dung trực quan và gửi ảnh GIF trong cuộc trò chuyện.	`media/gif-search`
`heartmula`	Thiết lập và chạy HeartMuLa, dòng mô hình tạo nhạc nguồn mở (giống như Suno). Tạo bài hát đầy đủ từ lời bài hát + thẻ với sự hỗ trợ đa ngôn ngữ.	`media/heartmula`
`songsee`	Tạo biểu đồ phổ và trực quan hóa tính năng âm thanh (mel, sắc độ, MFCC, tempogram, v.v.) từ các tệp âm thanh qua CLI. Hữu ích cho việc phân tích âm thanh, gỡ lỗi sản xuất âm nhạc và tài liệu trực quan.	`media/songsee`
`nội dung youtube`	Tìm nạp bản ghi video YouTube và chuyển chúng thành nội dung có cấu trúc (chương, tóm tắt, chủ đề, bài đăng trên blog).	`media/youtube-content`

lỗi

Các công cụ vận hành ML đa năng - quản lý trung tâm mô hình, vận hành tập dữ liệu và điều phối quy trình làm việc.

Kỹ năng	Mô tả	Đường dẫn
`Huggingface-hub`	Hugging Face Hub CLI (hf) — tìm kiếm, tải xuống và tải lên các mô hình và bộ dữ liệu, quản lý kho lưu trữ, triển khai các điểm cuối suy luận.	`mlops/huggingface-hub`

mlop/mây

Nhà cung cấp đám mây GPU và nền tảng điện toán serverless cho khối lượng công việc ML.

Kỹ năng	Mô tả	Đường dẫn
`lambda-labs-gpu-cloud`	Các phiên bản đám mây GPU dành riêng và theo yêu cầu để đào tạo và suy luận ML. Sử dụng khi bạn cần các phiên bản GPU chuyên dụng có khả năng truy cập SSH đơn giản, hệ thống tệp ổn định hoặc cụm nhiều nút hiệu suất cao để đào tạo trên quy mô lớn.	`mlops/cloud/lambda-labs`
`modal-serverless-gpu`	Nền tảng đám mây GPU không có máy chủ để chạy khối lượng công việc ML. Sử dụng khi bạn cần quyền truy cập GPU theo yêu cầu mà không cần quản lý cơ sở hạ tầng, triển khai mô hình ML dưới dạng API hoặc chạy các tác vụ hàng loạt với khả năng tự động điều chỉnh quy mô.	`mlops/cloud/modal`

mlop/đánh giá

Điểm chuẩn đánh giá mô hình, theo dõi thử nghiệm, quản lý dữ liệu, mã thông báo và các công cụ có thể diễn giải.

Kỹ năng	Mô tả	Đường dẫn
`đánh giá-llms-khai thác`	Đánh giá LLM trên hơn 60 điểm chuẩn học thuật (MMLU, HumanEval, GSM8K, TruthfulQA, HellaSwag). Sử dụng khi đo điểm chuẩn chất lượng mô hình, so sánh các mô hình, báo cáo kết quả học tập hoặc theo dõi tiến độ đào tạo. Tiêu chuẩn ngành được EleutherAI, HuggingFace và các phòng thí nghiệm lớn sử dụng. Súp…	`mlops/evaluation/lm-evaluation-harness`
`huggingface-tokenizers`	Mã thông báo nhanh được tối ưu hóa cho nghiên cứu và sản xuất. Việc triển khai dựa trên Rust sẽ mã hóa 1GB trong <20 giây. Hỗ trợ các thuật toán BPE, WordPiece và Unigram. Đào tạo từ vựng tùy chỉnh, sắp xếp theo dõi, xử lý phần đệm/cắt ngắn. Tích hợp liền mạch với máy biến áp. Sử dụng…	`mlops/đánh giá/huggingface-tokenizers`
`người quản lý nemo`	Quản lý dữ liệu được tăng tốc GPU cho đào tạo LLM. Hỗ trợ văn bản/hình ảnh/video/âm thanh. Tính năng chống trùng lặp mờ (nhanh hơn 16 lần), lọc chất lượng (hơn 30 phương pháp phỏng đoán), trùng lặp ngữ nghĩa, xử lý PII, phát hiện NSFW. Mở rộng quy mô trên các GPU bằng RAPIDS. Dùng để chế biến các món ăn chất lượng cao…	`mlops/đánh giá/người quản lý nemo`
`đào tạo tự động mã hóa thưa thớt`	Cung cấp hướng dẫn đào tạo và phân tích Bộ mã hóa tự động thưa thớt (SAE) bằng cách sử dụng SAELens để phân tách các hoạt động kích hoạt mạng thần kinh thành các tính năng có thể hiểu được. Sử dụng khi khám phá các đặc điểm có thể hiểu được, phân tích sự chồng chất hoặc nghiên cứu các cách biểu diễn đơn ngữ trong ngôn ngữ m…	`mlops/đánh giá/saelens`
`trọng lượng và thành kiến`	Theo dõi các thử nghiệm ML bằng tính năng ghi nhật ký tự động, trực quan hóa quá trình đào tạo trong thời gian thực, tối ưu hóa siêu tham số bằng tính năng quét và quản lý sổ đăng ký mô hình với W&B - nền tảng MLOps hợp tác	`mlops/đánh giá/trọng số và thành kiến`

mlop/suy luận

Phân phối mô hình, lượng tử hóa (GGUF/GPTQ), đầu ra có cấu trúc, tối ưu hóa suy luận và các công cụ phẫu thuật mô hình để triển khai và chạy LLM.

Kỹ năng	Mô tả	Đường dẫn
`gguf-lượng tử hóa`	Định dạng GGUF và lượng tử hóa llama.cpp để suy luận CPU/GPU hiệu quả. Sử dụng khi triển khai các mô hình trên phần cứng tiêu dùng, Apple Silicon hoặc khi cần lượng tử hóa linh hoạt từ 2-8 bit mà không yêu cầu GPU.	`mlops/suy luận/gguf`
`hướng dẫn`	Kiểm soát đầu ra LLM bằng biểu thức chính quy và ngữ pháp, đảm bảo việc tạo JSON/XML/mã hợp lệ, thực thi các định dạng có cấu trúc và xây dựng quy trình làm việc nhiều bước với Hướng dẫn - Khung tạo ràng buộc của Microsoft Research	`mlops/suy luận/hướng dẫn`
`người hướng dẫn`	Trích xuất dữ liệu có cấu trúc từ các phản hồi LLM với xác thực Pydantic, tự động thử lại các trích xuất không thành công, phân tích cú pháp JSON phức tạp với độ an toàn về loại và truyền phát một phần kết quả với Người hướng dẫn - thư viện đầu ra có cấu trúc đã được thử nghiệm trong trận chiến	`mlops/suy luận/người hướng dẫn`
`llama-cpp`	Chạy suy luận LLM trên CPU, Apple Silicon và GPU tiêu dùng không có phần cứng NVIDIA. Sử dụng để triển khai biên, máy Mac M1/M2/M3, GPU AMD/Intel hoặc khi CUDA không khả dụng. Hỗ trợ lượng tử hóa GGUF (1,5-8 bit) để giảm bộ nhớ và tăng tốc 4-10× so với PyTorch trên CPU.	`mlops/suy luận/llama-cpp`
`sự xóa bỏ`	Loại bỏ các hành vi từ chối khỏi LLM trọng lượng mở bằng cách sử dụng OBLITERATUS — các kỹ thuật có thể diễn giải cơ học (khác biệt về phương tiện, SVD, SVD được làm trắng, LEACE, phân tách SAE, v.v.) để loại bỏ các rào cản trong khi vẫn duy trì lý luận. 9 phương pháp CLI, 28 mô-đun phân tích, 116 cài đặt trước mô hình…	`mlops/inference/obliteratus`
`phác thảo`	Đảm bảo cấu trúc JSON/XML/mã hợp lệ trong quá trình tạo, sử dụng mô hình Pydantic cho đầu ra an toàn kiểu, hỗ trợ các mô hình cục bộ (Transformers, vLLM) và tối đa hóa tốc độ suy luận với Outlines - thư viện tạo có cấu trúc của dottxt.ai	`mlops/suy luận/phác thảo`
`phục vụ-llms-vllm`	Phục vụ LLM với thông lượng cao bằng cách sử dụng PagedAttention của vLLM và phân đợt liên tục. Sử dụng khi triển khai API LLM sản xuất, tối ưu hóa độ trễ/thông lượng suy luận hoặc phân phát các mô hình có bộ nhớ GPU hạn chế. Hỗ trợ các điểm cuối, lượng tử hóa tương thích với OpenAI (GPTQ/AWQ/FP8), và…	`mlops/suy luận/vllm`
`tensort-llm`	Tối ưu hóa suy luận LLM với NVIDIA TensorRT để có thông lượng tối đa và độ trễ thấp nhất. Sử dụng để triển khai sản xuất trên GPU NVIDIA (A100/H100), khi bạn cần suy luận nhanh hơn 10-100 lần so với PyTorch hoặc để phục vụ các mô hình có lượng tử hóa (FP8/INT4), phân khối trong chuyến bay và đa…	`mlops/suy luận/tensorrt-llm`

mlop/mô hình

Các công cụ và kiến trúc mô hình cụ thể — thị giác máy tính (CLIP, SAM, Khuếch tán ổn định), lời nói (Thì thầm), tạo âm thanh (AudioCraft) và mô hình đa phương thức (LLaVA).

Kỹ năng	Mô tả	Đường dẫn
`audiocraft-audio-thế hệ`	Thư viện PyTorch để tạo âm thanh bao gồm chuyển văn bản thành nhạc (MusicGen) và chuyển văn bản thành âm thanh (AudioGen). Sử dụng khi bạn cần tạo nhạc từ mô tả văn bản, tạo hiệu ứng âm thanh hoặc thực hiện tạo nhạc theo giai điệu.	`mlops/models/audiocraft`
`clip`	Mô hình kết nối tầm nhìn và ngôn ngữ của OpenAI. Cho phép phân loại hình ảnh không chụp, khớp văn bản hình ảnh và truy xuất đa phương thức. Được đào tạo về các cặp văn bản-hình ảnh 400M. Sử dụng để tìm kiếm hình ảnh, kiểm duyệt nội dung hoặc các tác vụ ngôn ngữ thị giác mà không cần tinh chỉnh. Tốt nhất cho mục đích chung…	`mlops/models/clip`
`llava`	Trợ lý ngôn ngữ và tầm nhìn lớn. Cho phép điều chỉnh hướng dẫn trực quan và hội thoại dựa trên hình ảnh. Kết hợp bộ mã hóa hình ảnh CLIP với các mô hình ngôn ngữ Vicuna/LLaMA. Hỗ trợ trò chuyện nhiều lượt bằng hình ảnh, trả lời câu hỏi trực quan và hướng dẫn sau. Sử dụng cho ngôn ngữ tầm nhìn…	`mlops/models/llava`
`mô hình phân khúc-bất cứ thứ gì`	Mô hình nền tảng cho việc phân đoạn hình ảnh với khả năng truyền không ảnh. Sử dụng khi bạn cần phân đoạn bất kỳ đối tượng nào trong hình ảnh bằng cách sử dụng các điểm, hộp hoặc mặt nạ làm lời nhắc hoặc tự động tạo tất cả các mặt nạ đối tượng trong hình ảnh.	`mlops/models/phân khúc-bất cứ thứ gì`
`ổn định-khuếch tán-hình ảnh`	Tạo văn bản thành hình ảnh tiên tiến nhất với các mô hình Khuếch tán ổn định thông qua Bộ khuếch tán HuggingFace. Sử dụng khi tạo hình ảnh từ lời nhắc văn bản, thực hiện dịch từ hình ảnh sang hình ảnh, vẽ nội dung hoặc xây dựng quy trình khuếch tán tùy chỉnh.	`mlops/models/ổn định-khuếch tán`
`thì thầm`	Mô hình nhận dạng giọng nói đa năng của OpenAI. Hỗ trợ 99 ngôn ngữ, phiên âm, dịch sang tiếng Anh và nhận dạng ngôn ngữ. Sáu kích thước mô hình từ nhỏ (thông số 39M) đến lớn (thông số 1550M). Sử dụng để chuyển giọng nói thành văn bản, phiên âm podcast hoặc xử lý âm thanh đa ngôn ngữ…	`mlops/models/thì thầm`

mlop/nghiên cứu

Khung nghiên cứu ML để xây dựng và tối ưu hóa hệ thống AI bằng lập trình khai báo.

Kỹ năng	Mô tả	Đường dẫn
`dpy`	Xây dựng các hệ thống AI phức tạp với lập trình khai báo, tự động tối ưu hóa lời nhắc, tạo các hệ thống và tác nhân RAG mô-đun với khung lập trình LM có hệ thống của DSPy - Stanford NLP	`mlops/nghiên cứu/dspy`

mlops/huấn luyện

Tinh chỉnh, đào tạo RLHF/DPO/GRPO, khung đào tạo được phân phối và các công cụ tối ưu hóa để đào tạo LLM và các mô hình khác.

Kỹ năng	Mô tả	Đường dẫn
`axolotl`	Hướng dẫn của chuyên gia về tinh chỉnh LLM với cấu hình Axolotl - YAML, hơn 100 mô hình, LoRA/QLoRA, DPO/KTO/ORPO/GRPO, hỗ trợ đa phương thức	`mlops/training/axolotl`
`distributed-llm-pretraining-torchtitan`	Cung cấp đào tạo trước LLM phân tán gốc PyTorch bằng cách sử dụng torchtitan với tính song song 4D (FSDP2, TP, PP, CP). Sử dụng khi đào tạo trước Llama 3.1, DeepSeek V3 hoặc các mô hình tùy chỉnh ở quy mô từ 8 đến 512+ GPU với Float8, torch.compile và điểm kiểm tra phân tán.	`mlops/training/torchtitan`
`tinh chỉnh-với-trl`	Tinh chỉnh LLM bằng cách học tăng cường với TRL - SFT để điều chỉnh hướng dẫn, DPO để căn chỉnh ưu tiên, PPO/GRPO để tối ưu hóa phần thưởng và đào tạo mô hình phần thưởng. Sử dụng khi cần RLHF, điều chỉnh mô hình theo sở thích hoặc đào tạo từ phản hồi của con người. Hoạt động với HuggingFace Tr…	`mlops/training/trl-tinh chỉnh`
`grpo-rl-đào tạo`	Hướng dẫn của chuyên gia về tinh chỉnh GRPO/RL với TRL để đào tạo mô hình lý luận và nhiệm vụ cụ thể	`mlops/training/grpo-rl-training`
`môi trường hermes-atropos`	Xây dựng, kiểm tra và gỡ lỗi môi trường Hermes Agent RL để đào tạo Atropos. Bao gồm giao diện HermesAgentBaseEnv, các chức năng khen thưởng, tích hợp vòng lặp tác nhân, đánh giá bằng các công cụ, ghi nhật ký đũa phép và ba chế độ CLI (phục vụ/xử lý/đánh giá). Sử dụng khi tạo, đánh giá hoặc f…	`mlops/training/hermes-atropos-environments`
`ôm mặt-tăng tốc`	API đào tạo phân tán đơn giản nhất. 4 dòng để thêm hỗ trợ phân tán cho bất kỳ tập lệnh PyTorch nào. API hợp nhất cho DeepSpeed/FSDP/Megatron/DDP. Vị trí thiết bị tự động, độ chính xác hỗn hợp (FP16/BF16/FP8). Cấu hình tương tác, lệnh khởi chạy duy nhất. Tiêu chuẩn hệ sinh thái HuggingFace.	`mlops/huấn luyện/tăng tốc`
`tối ưu hóa-chú ý-flash`	Tối ưu hóa sự chú ý của máy biến áp với Chú ý Flash để tăng tốc 2-4 lần và giảm bộ nhớ 10-20 lần. Sử dụng khi huấn luyện/chạy máy biến áp có chuỗi dài (>512 mã thông báo), gặp phải vấn đề về bộ nhớ GPU cần chú ý hoặc cần suy luận nhanh hơn. Hỗ trợ SDPA gốc PyTorch,…	`mlops/training/flash-chú ý`
`tinh chỉnh peft`	Tinh chỉnh tham số hiệu quả cho LLM bằng các phương pháp LoRA, QLoRA và 25+. Sử dụng khi tinh chỉnh các mô hình lớn (7B-70B) có bộ nhớ GPU hạn chế, khi bạn cần huấn luyện <1% tham số với mức độ mất độ chính xác tối thiểu hoặc để phân phối nhiều bộ chuyển đổi. Thư viện chính thức của HuggingFace i…	`mlops/training/peft`
`pytorch-fsdp`	Hướng dẫn của chuyên gia về Đào tạo song song dữ liệu được phân chia hoàn toàn với PyTorch FSDP - phân chia tham số, độ chính xác hỗn hợp, giảm tải CPU, FSDP2	`mlops/đào tạo/pytorch-fsdp`
`pytorch-sét`	Khung PyTorch cấp cao với lớp Huấn luyện viên, đào tạo phân tán tự động (DDP/FSDP/DeepSpeed), hệ thống gọi lại và bản soạn sẵn tối thiểu. Cân từ laptop đến siêu máy tính cùng mã. Sử dụng khi bạn muốn vòng lặp đào tạo rõ ràng với các phương pháp hay nhất được tích hợp sẵn.	`mlops/training/pytorch-sét`
`đào tạo đơn giản`	Tối ưu hóa tùy chọn đơn giản để căn chỉnh LLM. Giải pháp thay thế không cần tham chiếu cho DPO với hiệu suất tốt hơn (+6,4 điểm trên AlpacaEval 2.0). Không cần mô hình tham chiếu, hiệu quả hơn DPO. Sử dụng để căn chỉnh tùy chọn khi muốn đào tạo đơn giản hơn, nhanh hơn DPO/PPO.	`mlops/training/simpo`
`slime-rl-đào tạo`	Cung cấp hướng dẫn về đào tạo sau LLM với RL bằng cách sử dụng slime, khung Megatron+SGLang. Sử dụng khi đào tạo các mô hình GLM, triển khai quy trình tạo dữ liệu tùy chỉnh hoặc cần tích hợp chặt chẽ Megatron-LM để mở rộng quy mô RL.	`mlops/huấn luyện/chất nhờn`
`unsloth`	Expert guidance for fast fine-tuning with Unsloth - 2-5x faster training, 50-80% less memory, LoRA/QLoRA optimization	`mlops/training/unsloth`

mlops/vector-databases

Vector similarity search and embedding databases for RAG, semantic search, and AI application backends.

Skill	Description	Path
`chroma`	Open-source embedding database for AI applications. Store embeddings and metadata, perform vector and full-text search, filter by metadata. Simple 4-function API. Scales from notebooks to production clusters. Use for semantic search, RAG applications, or document retrieval. Best…	`mlops/vector-databases/chroma`
`faiss`	Facebook's library for efficient similarity search and clustering of dense vectors. Supports billions of vectors, GPU acceleration, and various index types (Flat, IVF, HNSW). Use for fast k-NN search, large-scale vector retrieval, or when you need pure similarity search without…	`mlops/vector-databases/faiss`
`pinecone`	Managed vector database for production AI applications. Fully managed, auto-scaling, with hybrid search (dense + sparse), metadata filtering, and namespaces. Low latency (<100ms p95). Use for production RAG, recommendation systems, or semantic search at scale. Best for server…	`mlops/vector-databases/pinecone`
`qdrant-vector-search`	High-performance vector similarity search engine for RAG and semantic search. Use when building production RAG systems requiring fast nearest neighbor search, hybrid search with filtering, or scalable vector storage with Rust-powered performance.	`mlops/vector-databases/qdrant`

note-taking

Note taking skills, to save information, assist with research, and collab on multi-session planning and information sharing.

Skill	Description	Path
`obsidian`	Read, search, and create notes in the Obsidian vault.	`note-taking/obsidian`

productivity

Skills for document creation, presentations, spreadsheets, and other productivity workflows.

Skill	Description	Path
`google-workspace`	Gmail, Calendar, Drive, Contacts, Sheets, and Docs integration via Python. Uses OAuth2 with automatic token refresh. No external binaries needed — runs entirely with Google's Python client libraries in the Hermes venv.	`productivity/google-workspace`
`linear`	Manage Linear issues, projects, and teams via the GraphQL API. Create, update, search, and organize issues.	`productivity/linear`
`nano-pdf`	Edit PDFs with natural-language instructions using the nano-pdf CLI. Modify text, fix typos, update titles, and make content changes to specific pages without manual editing.	`productivity/nano-pdf`
`notion`	Notion API for creating and managing pages, databases, and blocks via curl. Search, create, update, and query Notion workspaces directly from the terminal.	`productivity/notion`
`ocr-and-documents`	Extract text from PDFs and scanned documents. Use web_extract for remote URLs, pymupdf for local text-based PDFs, marker-pdf for OCR/scanned docs. For DOCX use python-docx, for PPTX see the powerpoint skill.	`productivity/ocr-and-documents`
`powerpoint`	"Use this skill any time a .pptx file is involved in any way — as input, output, or both. This includes: creating slide decks, pitch decks, or presentations; reading, parsing, or extracting text from any .pptx file (even if the extracted content will be used elsewhere, like in a…	`productivity/powerpoint`

research

Skills for academic research, paper discovery, literature review, domain reconnaissance, market data, content monitoring, and scientific knowledge retrieval.

Skill	Description	Path
`arxiv`	Search and retrieve academic papers from arXiv using their free REST API. No API key needed. Search by keyword, author, category, or ID. Combine with web_extract or the ocr-and-documents skill to read full paper content.	`research/arxiv`
`blogwatcher`	Monitor blogs and RSS/Atom feeds for updates using the blogwatcher CLI. Add blogs, scan for new articles, and track what you've read.	`research/blogwatcher`
`llm-wiki`	Karpathy's LLM Wiki — build and maintain a persistent, interlinked markdown knowledge base. Ingest sources, query compiled knowledge, and lint for consistency. Unlike RAG, the wiki compiles knowledge once and keeps it current. Works as an Obsidian vault. Configurable via `skills.config.wiki.path`.	`research/llm-wiki`
`domain-intel`	Passive domain reconnaissance using Python stdlib. Subdomain discovery, SSL certificate inspection, WHOIS lookups, DNS records, domain availability checks, and bulk multi-domain analysis. No API keys required.	`research/domain-intel`
`duckduckgo-search`	Free web search via DuckDuckGo — text, news, images, videos. No API key needed. Prefer the `ddgs` CLI when installed; use the Python DDGS library only after verifying that `ddgs` is available in the current runtime.	`research/duckduckgo-search`
`ml-paper-writing`	Write publication-ready ML/AI papers for NeurIPS, ICML, ICLR, ACL, AAAI, COLM. Use when drafting papers from research repos, structuring arguments, verifying citations, or preparing camera-ready submissions. Includes LaTeX templates, reviewer guidelines, and citation verificatio…	`research/ml-paper-writing`
`polymarket`	Query Polymarket prediction market data — search markets, get prices, orderbooks, and price history. Read-only via public REST APIs, no API key needed.	`research/polymarket`

red-teaming

Skills for LLM red-teaming, jailbreaking, and safety filter bypass research.

Skill	Description	Path
`godmode`	Jailbreak API-served LLMs using G0DM0D3 techniques — Parseltongue input obfuscation (33 techniques), GODMODE CLASSIC system prompt templates, ULTRAPLINIAN multi-model racing, encoding escalation, and Hermes-native prefill/system prompt integration. Works on any model accessible via API including closed-source models.	`red-teaming/godmode`

smart-home

Skills for controlling smart home devices — lights, switches, sensors, and home automation systems.

Skill	Description	Path
`openhue`	Control Philips Hue lights, rooms, and scenes via the OpenHue CLI. Turn lights on/off, adjust brightness, color, color temperature, and activate scenes.	`smart-home/openhue`

Skills for interacting with social platforms — posting, reading, monitoring, and account operations.

Skill	Description	Path
`xitter`	Interact with X/Twitter via the x-cli terminal client using official X API credentials.	`social-media/xitter`

software-development

Skill	Description	Path
`code-review`	Guidelines for performing thorough code reviews with security and quality focus	`software-development/code-review`
`plan`	Plan mode for Hermes — inspect context, write a markdown plan into `.hermes/plans/` in the active workspace/backend working directory, and do not execute the work.	`software-development/plan`
`requesting-code-review`	Use when completing tasks, implementing major features, or before merging. Validates work meets requirements through systematic review process.	`software-development/requesting-code-review`
`subagent-driven-development`	Use when executing implementation plans with independent tasks. Dispatches fresh delegate_task per task with two-stage review (spec compliance then code quality).	`software-development/subagent-driven-development`
`systematic-debugging`	Use when encountering any bug, test failure, or unexpected behavior. 4-phase root cause investigation — NO fixes without understanding the problem first.	`software-development/systematic-debugging`
`test-driven-development`	Use when implementing any feature or bugfix, before writing implementation code. Enforces RED-GREEN-REFACTOR cycle with test-first approach.	`software-development/test-driven-development`
`writing-plans`	Use when you have a spec or requirements for a multi-step task. Creates comprehensive implementation plans with bite-sized tasks, exact file paths, and complete code examples.	`software-development/writing-plans`

Optional Skills

Optional skills ship with the repository under optional-skills/ but are not active by default. They cover heavier or niche use cases. Install them with:

hermes skills install official/<category>/<skill>

autonomous-ai-agents

Skill	Description	Path
`blackbox`	Delegate coding tasks to Blackbox AI CLI agent. Multi-model agent with built-in judge that runs tasks through multiple LLMs and picks the best result. Requires the blackbox CLI and a Blackbox AI API key.	`autonomous-ai-agents/blackbox`

blockchain

Skill	Description	Path
`base`	Query Base (Ethereum L2) blockchain data with USD pricing — wallet balances, token info, transaction details, gas analysis, contract inspection, whale detection, and live network stats. Uses Base RPC + CoinGecko. No API key required.	`blockchain/base`
`solana`	Query Solana blockchain data with USD pricing — wallet balances, token portfolios with values, transaction details, NFTs, whale detection, and live network stats. Uses Solana RPC + CoinGecko. No API key required.	`blockchain/solana`

creative

Skill	Description	Path
`blender-mcp`	Control Blender directly from Hermes via socket connection to the blender-mcp addon. Create 3D objects, materials, animations, and run arbitrary Blender Python (bpy) code.	`creative/blender-mcp`
`meme-generation`	Generate real meme images by picking a template and overlaying text with Pillow. Produces actual .png meme files.	`creative/meme-generation`

devops

Skill	Description	Path
`docker-management`	Manage Docker containers, images, volumes, networks, and Compose stacks — lifecycle ops, debugging, cleanup, and Dockerfile optimization.	`devops/docker-management`

email

Skill	Description	Path
`agentmail`	Give the agent its own dedicated email inbox via AgentMail. Send, receive, and manage email autonomously using agent-owned email addresses (e.g. hermes-agent@agentmail.to).	`email/agentmail`

health

Skill	Description	Path
`neuroskill-bci`	Connect to a running NeuroSkill instance and incorporate the user's real-time cognitive and emotional state (focus, relaxation, mood, cognitive load, drowsiness, heart rate, HRV, sleep staging, and 40+ derived EXG scores) into responses. Requires a BCI wearable (Muse 2/S or OpenBCI) and the NeuroSkill desktop app.	`health/neuroskill-bci`

mcp

Skill	Description	Path
`fastmcp`	Build, test, inspect, install, and deploy MCP servers with FastMCP in Python. Use when creating a new MCP server, wrapping an API or database as MCP tools, exposing resources or prompts, or preparing a FastMCP server for HTTP deployment.	`mcp/fastmcp`

migration

Skill	Description	Path
`openclaw-migration`	Migrate a user's OpenClaw customization footprint into Hermes Agent. Imports Hermes-compatible memories, SOUL.md, command allowlists, user skills, and selected workspace assets from ~/.openclaw, then reports what could not be migrated and why.	`migration/openclaw-migration`

productivity

Skill	Description	Path
`telephony`	Give Hermes phone capabilities — provision and persist a Twilio number, send and receive SMS/MMS, make direct calls, and place AI-driven outbound calls through Bland.ai or Vapi.	`productivity/telephony`

research

Skill	Description	Path
`bioinformatics`	Gateway to 400+ bioinformatics skills from bioSkills and ClawBio. Covers genomics, transcriptomics, single-cell, variant calling, pharmacogenomics, metagenomics, structural biology, and more.	`research/bioinformatics`
`qmd`	Search personal knowledge bases, notes, docs, and meeting transcripts locally using qmd — a hybrid retrieval engine with BM25, vector search, and LLM reranking. Supports CLI and MCP integration.	`research/qmd`

security

Skill	Description	Path
`1password`	Set up and use 1Password CLI (op). Use when installing the CLI, enabling desktop app integration, signing in, and reading/injecting secrets for commands.	`security/1password`
`oss-forensics`	Supply chain investigation, evidence recovery, and forensic analysis for GitHub repositories. Covers deleted commit recovery, force-push detection, IOC extraction, multi-source evidence collection, and structured forensic reporting.	`security/oss-forensics`
`sherlock`	OSINT username search across 400+ social networks. Hunt down social media accounts by username.	`security/sherlock`

quả táo​

tác nhân ai tự trị​

khoa học dữ liệu​

sáng tạo​

nhà phát triển​

email​

chơi game​

suy luận-sh​

thời gian rảnh rỗi​

phương tiện truyền thông​

lỗi​

mlop/mây​

mlop/đánh giá​

mlop/suy luận​

mlop/mô hình​

mlop/nghiên cứu​

mlops/huấn luyện​

mlops/vector-databases​

note-taking​

productivity​

research​

red-teaming​

smart-home​

social-media​

software-development​

Optional Skills

autonomous-ai-agents​

blockchain​

creative​

devops​

email​

health​

mcp​

migration​

productivity​

research​

security​

quả táo

tác nhân ai tự trị

khoa học dữ liệu

sáng tạo

nhà phát triển

email

chơi game

suy luận-sh

thời gian rảnh rỗi

phương tiện truyền thông

lỗi

mlop/mây

mlop/đánh giá

mlop/suy luận

mlop/mô hình

mlop/nghiên cứu

mlops/huấn luyện

mlops/vector-databases

note-taking

productivity

research

red-teaming

smart-home

social-media

software-development

autonomous-ai-agents

blockchain

creative

devops

email

health

mcp

migration

productivity

research

security