Chuyển tới nội dung chính

Danh mục kỹ năng đi kèm

Hermes cung cấp một thư viện kỹ năng tích hợp lớn được sao chép vào ~/.hermes/skills/ khi cài đặt. Trang này liệt kê các kỹ năng đi kèm có trong kho dưới mục skills/.

quả táo

Các kỹ năng dành riêng cho Apple/macOS - tự động hóa iMessage, Lời nhắc, Ghi chú, FindMy và macOS. Những kỹ năng này chỉ tải trên hệ thống macOS.

Kỹ năngMô tảĐường dẫn
ghi chú táoQuản lý Apple Notes thông qua bản ghi nhớ CLI trên macOS (tạo, xem, tìm kiếm, chỉnh sửa).táo/táo-ghi chú
táo-nhắc nhởQuản lý Lời nhắc của Apple thông qua Remindctl CLI (liệt kê, thêm, hoàn thành, xóa).apple/apple-nhắc nhở
tìm tôiTheo dõi các thiết bị Apple và AirTags thông qua FindMy.app trên macOS bằng AppleScript và chụp ảnh màn hình.táo/tìmmy
tin nhắnGửi và nhận iMessages/SMS qua imsg CLI trên macOS.táo/imessage

tác nhân ai tự trị

Kỹ năng tạo ra và điều phối các tác nhân mã hóa AI tự động và quy trình làm việc của nhiều tác nhân - chạy các quy trình tác nhân độc lập, phân công nhiệm vụ và điều phối các luồng công việc song song.

Kỹ năngMô tảĐường dẫn
mã claudeGiao nhiệm vụ mã hóa cho Claude Code (đại diện CLI của Anthropic). Sử dụng để xây dựng các tính năng, tái cấu trúc, đánh giá PR và mã hóa lặp lại. Yêu cầu claude CLI được cài đặt.tác nhân-ai-tự trị/claude-code
codexỦy quyền các nhiệm vụ mã hóa cho tác nhân OpenAI Codex CLI. Sử dụng để xây dựng các tính năng, tái cấu trúc, đánh giá PR và sửa lỗi hàng loạt. Yêu cầu codex CLI và kho lưu trữ git.tác nhân-ai-tự trị/codex
hermes-đại lý-sinh sảnTạo ra các phiên bản Đại lý Hermes bổ sung dưới dạng các quy trình con tự động cho các tác vụ dài hạn độc lập. Hỗ trợ chế độ một lần không tương tác (-q) và chế độ PTY tương tác để cộng tác nhiều lượt. Khác với delegate_task — thao tác này chạy một quy trình Hermes hoàn toàn riêng biệt.tác nhân-ai-tự trị/tác nhân-hermes
mã mởỦy quyền các nhiệm vụ mã hóa cho tác nhân OpenCode CLI để triển khai tính năng, tái cấu trúc, đánh giá PR và các phiên tự trị kéo dài. Yêu cầu cài đặt và xác thực mã mở CLI.tác nhân-ai-tự trị/opencode

khoa học dữ liệu

Kỹ năng dành cho quy trình làm việc của khoa học dữ liệu - khám phá tương tác, sổ ghi chép Jupyter, phân tích dữ liệu và trực quan hóa.

Kỹ năngMô tảĐường dẫn
jupyter-live-kernelSử dụng nhân Jupyter trực tiếp để thực thi Python lặp lại, có trạng thái thông qua hamelnb. Tải kỹ năng này khi nhiệm vụ liên quan đến việc khám phá, lặp lại hoặc kiểm tra các kết quả trung gian.khoa học dữ liệu/jupyter-live-kernel

sáng tạo

Tạo nội dung sáng tạo - nghệ thuật ASCII, sơ đồ kiểu vẽ tay và các công cụ thiết kế trực quan.

Kỹ năngMô tảĐường dẫn
ascii-nghệ thuậtTạo tác phẩm nghệ thuật ASCII bằng cách sử dụng pyfiglet (571 phông chữ), cowsay, hộp, toilet, image-to-ascii, API từ xa (asciified, ascii.co.uk) và dự phòng LLM. Không cần khóa API.sáng tạo/ascii-nghệ thuật
ascii-video"Quy trình sản xuất video nghệ thuật ASCII — bất kỳ định dạng nào. Chuyển đổi video/âm thanh/hình ảnh/đầu vào tổng hợp thành đầu ra video ký tự ASCII màu (MP4, GIF, chuỗi hình ảnh). Bao gồm: chuyển đổi video sang ASCII, trình hiển thị nhạc phản ứng âm thanh, hoạt hình nghệ thuật ASCII tổng quát, kết hợp…sáng tạo/ascii-video
excalidrawTạo sơ đồ kiểu vẽ tay bằng định dạng Excalidraw JSON. Tạo tệp .excalidraw cho sơ đồ kiến ​​trúc, sơ đồ, sơ đồ trình tự, bản đồ khái niệm, v.v. Các tập tin có thể được mở tại excalidraw.com hoặc tải lên để có các liên kết có thể chia sẻ.sáng tạo/excalidraw
p5jsQuy trình sản xuất nghệ thuật thị giác mang tính tương tác và sáng tạo bằng cách sử dụng p5.js. Tạo bản phác thảo, hiển thị chúng thành hình ảnh/video thông qua trình duyệt không có giao diện người dùng và cung cấp bản xem trước trực tiếp. Hỗ trợ hoạt ảnh canvas, trực quan hóa dữ liệu và thử nghiệm mã hóa sáng tạo.sáng tạo/p5js

nhà phát triển

DevOps và kỹ năng tự động hóa cơ sở hạ tầng.

Kỹ năngMô tảĐường dẫn
đăng ký webhookTạo và quản lý đăng ký webhook để kích hoạt tổng đài viên theo sự kiện. Sự kiện POST của các dịch vụ bên ngoài (GitHub, Stripe, CI/CD, IoT) để kích hoạt hoạt động của tác nhân. Yêu cầu bật nền tảng webhook.devops/webhook-đăng ký

##thức ăn cho chó

Kỹ năngMô tảĐường dẫn
thức ăn cho chóKiểm tra QA khám phá có hệ thống các ứng dụng web - tìm lỗi, thu thập bằng chứng và tạo báo cáo có cấu trúc.thức ăn cho chó/thức ăn cho chó
hermes-agent-setupGiúp người dùng định cấu hình Tác nhân Hermes — cách sử dụng CLI, trình hướng dẫn thiết lập, lựa chọn kiểu máy/nhà cung cấp, công cụ, kỹ năng, giọng nói/STT/TTS, cổng và khắc phục sự cố.dogfood/hermes-agent-setup

email

Kỹ năng gửi, nhận, tìm kiếm và quản lý email từ thiết bị đầu cuối.

Kỹ năngMô tảĐường dẫn
himalayaCLI để quản lý email qua IMAP/SMTP. Sử dụng Himalaya để liệt kê, đọc, viết, trả lời, chuyển tiếp, tìm kiếm và sắp xếp email từ thiết bị đầu cuối. Hỗ trợ nhiều tài khoản và soạn tin nhắn với MML (Ngôn ngữ meta MIME).email/himalaya

chơi game

Kỹ năng thiết lập, định cấu hình và quản lý máy chủ trò chơi, gói mod và cơ sở hạ tầng liên quan đến trò chơi.

Kỹ năngMô tảĐường dẫn
minecraft-modpack-serverThiết lập máy chủ Minecraft đã được sửa đổi từ gói zip máy chủ CurseForge/Modrinth. Bao gồm cài đặt NeoForge/Forge, phiên bản Java, điều chỉnh JVM, tường lửa, cấu hình mạng LAN, bản sao lưu và tập lệnh khởi chạy.chơi game/minecraft-modpack-server
người chơi pokemonChơi trò chơi Pokemon một cách tự động thông qua mô phỏng không cần đầu. Khởi động máy chủ trò chơi, đọc trạng thái trò chơi có cấu trúc từ RAM, đưa ra quyết định chiến lược và gửi đầu vào nút — tất cả đều từ thiết bị đầu cuối.chơi game/người chơi pokemon

##github

Kỹ năng xử lý công việc của GitHub để quản lý kho lưu trữ, yêu cầu kéo, đánh giá mã, sự cố và quy trình CI/CD bằng cách sử dụng gh CLI và git qua thiết bị đầu cuối.

Kỹ năngMô tảĐường dẫn
kiểm tra cơ sở mãKiểm tra và phân tích cơ sở mã bằng cách sử dụng pygount để đếm LỘC, phân tích ngôn ngữ và tỷ lệ mã so với nhận xét. Sử dụng khi được yêu cầu kiểm tra các dòng mã, kích thước kho lưu trữ, thành phần ngôn ngữ hoặc số liệu thống kê về cơ sở mã.github/codebase-kiểm tra
github-authThiết lập xác thực GitHub cho tác nhân bằng git (có sẵn phổ biến) hoặc gh CLI. Bao gồm mã thông báo HTTPS, khóa SSH, trình trợ giúp thông tin xác thực và gh auth — với quy trình phát hiện để tự động chọn phương thức phù hợp.github/github-auth
github-code-reviewXem xét các thay đổi mã bằng cách phân tích các điểm khác biệt của git, để lại nhận xét nội tuyến về PR và thực hiện đánh giá kỹ lưỡng trước khi đẩy. Hoạt động với gh CLI hoặc quay lại API git + GitHub REST thông qua cuộn tròn.github/github-code-review
github-vấn đềTạo, quản lý, phân loại và đóng các sự cố GitHub. Tìm kiếm các vấn đề hiện có, thêm nhãn, chỉ định người và liên kết tới PR. Hoạt động với gh CLI hoặc quay lại API git + GitHub REST thông qua cuộn tròn.github/github-issues
github-pr-workflowVòng đời yêu cầu kéo đầy đủ - tạo nhánh, cam kết thay đổi, mở PR, theo dõi trạng thái CI, tự động sửa lỗi và hợp nhất. Hoạt động với gh CLI hoặc quay lại API git + GitHub REST thông qua cuộn tròn.github/github-pr-workflow
github-repo-quản lýSao chép, tạo, phân nhánh, định cấu hình và quản lý kho lưu trữ GitHub. Quản lý điều khiển từ xa, bí mật, bản phát hành và quy trình làm việc. Hoạt động với gh CLI hoặc quay lại API git + GitHub REST thông qua cuộn tròn.github/github-repo-quản lý

suy luận-sh

Kỹ năng thực thi ứng dụng AI thông qua nền tảng đám mây suy luận.sh.

Kỹ năngMô tảĐường dẫn
suy luận-sh-cliChạy hơn 150 ứng dụng AI thông qua inference.sh CLI (infsh) - tạo hình ảnh, tạo video, LLM, tìm kiếm, 3D, tự động hóa xã hội.suy luận-sh/cli

thời gian rảnh rỗi

Kỹ năngMô tảĐường dẫn
tìm-gầnTìm các địa điểm lân cận (nhà hàng, quán cà phê, quán bar, hiệu thuốc, v.v.) bằng OpenStreetMap. Hoạt động với tọa độ, địa chỉ, thành phố, mã zip hoặc ghim vị trí của Telegram. Không cần khóa API.giải trí/tìm-gần

##mcp

Kỹ năng làm việc với máy chủ, công cụ và tích hợp MCP (Giao thức bối cảnh mô hình). Bao gồm ứng dụng khách MCP gốc được tích hợp sẵn (cấu hình máy chủ trong config.yaml để khám phá công cụ tự động) và cầu nối CLI của mcporter để tương tác với máy chủ đặc biệt.

Kỹ năngMô tảĐường dẫn
mcporterSử dụng mcporter CLI để liệt kê, định cấu hình, xác thực và gọi trực tiếp các máy chủ/công cụ MCP (HTTP hoặc stdio), bao gồm máy chủ đặc biệt, chỉnh sửa cấu hình và tạo CLI/loại.mcp/mcporter
bản địa-mcpMáy khách MCP (Giao thức bối cảnh mô hình) tích hợp kết nối với các máy chủ MCP bên ngoài, khám phá các công cụ của chúng và đăng ký chúng dưới dạng công cụ Đại lý Hermes gốc. Hỗ trợ truyền tải stdio và HTTP với khả năng kết nối lại tự động, lọc bảo mật và chèn công cụ không cấu hình.mcp/bản địa-mcp

phương tiện truyền thông

Kỹ năng làm việc với nội dung đa phương tiện - Bản ghi YouTube, tìm kiếm GIF, tạo nhạc và hiển thị âm thanh.

Kỹ năngMô tảĐường dẫn
tìm kiếm gifTìm kiếm và tải xuống ảnh GIF từ Tenor bằng cách sử dụng tính năng cuộn tròn. Không có sự phụ thuộc nào ngoài Curl và jq. Hữu ích khi tìm ảnh GIF phản ứng, tạo nội dung trực quan và gửi ảnh GIF trong cuộc trò chuyện.media/gif-search
heartmulaThiết lập và chạy HeartMuLa, dòng mô hình tạo nhạc nguồn mở (giống như Suno). Tạo bài hát đầy đủ từ lời bài hát + thẻ với sự hỗ trợ đa ngôn ngữ.media/heartmula
songseeTạo biểu đồ phổ và trực quan hóa tính năng âm thanh (mel, sắc độ, MFCC, tempogram, v.v.) từ các tệp âm thanh qua CLI. Hữu ích cho việc phân tích âm thanh, gỡ lỗi sản xuất âm nhạc và tài liệu trực quan.media/songsee
nội dung youtubeTìm nạp bản ghi video YouTube và chuyển chúng thành nội dung có cấu trúc (chương, tóm tắt, chủ đề, bài đăng trên blog).media/youtube-content

lỗi

Các công cụ vận hành ML đa năng - quản lý trung tâm mô hình, vận hành tập dữ liệu và điều phối quy trình làm việc.

Kỹ năngMô tảĐường dẫn
Huggingface-hubHugging Face Hub CLI (hf) — tìm kiếm, tải xuống và tải lên các mô hình và bộ dữ liệu, quản lý kho lưu trữ, triển khai các điểm cuối suy luận.mlops/huggingface-hub

mlop/mây

Nhà cung cấp đám mây GPU và nền tảng điện toán serverless cho khối lượng công việc ML.

Kỹ năngMô tảĐường dẫn
lambda-labs-gpu-cloudCác phiên bản đám mây GPU dành riêng và theo yêu cầu để đào tạo và suy luận ML. Sử dụng khi bạn cần các phiên bản GPU chuyên dụng có khả năng truy cập SSH đơn giản, hệ thống tệp ổn định hoặc cụm nhiều nút hiệu suất cao để đào tạo trên quy mô lớn.mlops/cloud/lambda-labs
modal-serverless-gpuNền tảng đám mây GPU không có máy chủ để chạy khối lượng công việc ML. Sử dụng khi bạn cần quyền truy cập GPU theo yêu cầu mà không cần quản lý cơ sở hạ tầng, triển khai mô hình ML dưới dạng API hoặc chạy các tác vụ hàng loạt với khả năng tự động điều chỉnh quy mô.mlops/cloud/modal

mlop/đánh giá

Điểm chuẩn đánh giá mô hình, theo dõi thử nghiệm, quản lý dữ liệu, mã thông báo và các công cụ có thể diễn giải.

Kỹ năngMô tảĐường dẫn
đánh giá-llms-khai thácĐánh giá LLM trên hơn 60 điểm chuẩn học thuật (MMLU, HumanEval, GSM8K, TruthfulQA, HellaSwag). Sử dụng khi đo điểm chuẩn chất lượng mô hình, so sánh các mô hình, báo cáo kết quả học tập hoặc theo dõi tiến độ đào tạo. Tiêu chuẩn ngành được EleutherAI, HuggingFace và các phòng thí nghiệm lớn sử dụng. Súp…mlops/evaluation/lm-evaluation-harness
huggingface-tokenizersMã thông báo nhanh được tối ưu hóa cho nghiên cứu và sản xuất. Việc triển khai dựa trên Rust sẽ mã hóa 1GB trong <20 giây. Hỗ trợ các thuật toán BPE, WordPiece và Unigram. Đào tạo từ vựng tùy chỉnh, sắp xếp theo dõi, xử lý phần đệm/cắt ngắn. Tích hợp liền mạch với máy biến áp. Sử dụng…mlops/đánh giá/huggingface-tokenizers
người quản lý nemoQuản lý dữ liệu được tăng tốc GPU cho đào tạo LLM. Hỗ trợ văn bản/hình ảnh/video/âm thanh. Tính năng chống trùng lặp mờ (nhanh hơn 16 lần), lọc chất lượng (hơn 30 phương pháp phỏng đoán), trùng lặp ngữ nghĩa, xử lý PII, phát hiện NSFW. Mở rộng quy mô trên các GPU bằng RAPIDS. Dùng để chế biến các món ăn chất lượng cao…mlops/đánh giá/người quản lý nemo
đào tạo tự động mã hóa thưa thớtCung cấp hướng dẫn đào tạo và phân tích Bộ mã hóa tự động thưa thớt (SAE) bằng cách sử dụng SAELens để phân tách các hoạt động kích hoạt mạng thần kinh thành các tính năng có thể hiểu được. Sử dụng khi khám phá các đặc điểm có thể hiểu được, phân tích sự chồng chất hoặc nghiên cứu các cách biểu diễn đơn ngữ trong ngôn ngữ m…mlops/đánh giá/saelens
trọng lượng và thành kiếnTheo dõi các thử nghiệm ML bằng tính năng ghi nhật ký tự động, trực quan hóa quá trình đào tạo trong thời gian thực, tối ưu hóa siêu tham số bằng tính năng quét và quản lý sổ đăng ký mô hình với W&B - nền tảng MLOps hợp tácmlops/đánh giá/trọng số và thành kiến

mlop/suy luận

Phân phối mô hình, lượng tử hóa (GGUF/GPTQ), đầu ra có cấu trúc, tối ưu hóa suy luận và các công cụ phẫu thuật mô hình để triển khai và chạy LLM.

Kỹ năngMô tảĐường dẫn
gguf-lượng tử hóaĐịnh dạng GGUF và lượng tử hóa llama.cpp để suy luận CPU/GPU hiệu quả. Sử dụng khi triển khai các mô hình trên phần cứng tiêu dùng, Apple Silicon hoặc khi cần lượng tử hóa linh hoạt từ 2-8 bit mà không yêu cầu GPU.mlops/suy luận/gguf
hướng dẫnKiểm soát đầu ra LLM bằng biểu thức chính quy và ngữ pháp, đảm bảo việc tạo JSON/XML/mã hợp lệ, thực thi các định dạng có cấu trúc và xây dựng quy trình làm việc nhiều bước với Hướng dẫn - Khung tạo ràng buộc của Microsoft Researchmlops/suy luận/hướng dẫn
người hướng dẫnTrích xuất dữ liệu có cấu trúc từ các phản hồi LLM với xác thực Pydantic, tự động thử lại các trích xuất không thành công, phân tích cú pháp JSON phức tạp với độ an toàn về loại và truyền phát một phần kết quả với Người hướng dẫn - thư viện đầu ra có cấu trúc đã được thử nghiệm trong trận chiếnmlops/suy luận/người hướng dẫn
llama-cppChạy suy luận LLM trên CPU, Apple Silicon và GPU tiêu dùng không có phần cứng NVIDIA. Sử dụng để triển khai biên, máy Mac M1/M2/M3, GPU AMD/Intel hoặc khi CUDA không khả dụng. Hỗ trợ lượng tử hóa GGUF (1,5-8 bit) để giảm bộ nhớ và tăng tốc 4-10× so với PyTorch trên CPU.mlops/suy luận/llama-cpp
sự xóa bỏLoại bỏ các hành vi từ chối khỏi LLM trọng lượng mở bằng cách sử dụng OBLITERATUS — các kỹ thuật có thể diễn giải cơ học (khác biệt về phương tiện, SVD, SVD được làm trắng, LEACE, phân tách SAE, v.v.) để loại bỏ các rào cản trong khi vẫn duy trì lý luận. 9 phương pháp CLI, 28 mô-đun phân tích, 116 cài đặt trước mô hình…mlops/inference/obliteratus
phác thảoĐảm bảo cấu trúc JSON/XML/mã hợp lệ trong quá trình tạo, sử dụng mô hình Pydantic cho đầu ra an toàn kiểu, hỗ trợ các mô hình cục bộ (Transformers, vLLM) và tối đa hóa tốc độ suy luận với Outlines - thư viện tạo có cấu trúc của dottxt.aimlops/suy luận/phác thảo
phục vụ-llms-vllmPhục vụ LLM với thông lượng cao bằng cách sử dụng PagedAttention của vLLM và phân đợt liên tục. Sử dụng khi triển khai API LLM sản xuất, tối ưu hóa độ trễ/thông lượng suy luận hoặc phân phát các mô hình có bộ nhớ GPU hạn chế. Hỗ trợ các điểm cuối, lượng tử hóa tương thích với OpenAI (GPTQ/AWQ/FP8), và…mlops/suy luận/vllm
tensort-llmTối ưu hóa suy luận LLM với NVIDIA TensorRT để có thông lượng tối đa và độ trễ thấp nhất. Sử dụng để triển khai sản xuất trên GPU NVIDIA (A100/H100), khi bạn cần suy luận nhanh hơn 10-100 lần so với PyTorch hoặc để phục vụ các mô hình có lượng tử hóa (FP8/INT4), phân khối trong chuyến bay và đa…mlops/suy luận/tensorrt-llm

mlop/mô hình

Các công cụ và kiến ​​trúc mô hình cụ thể — thị giác máy tính (CLIP, SAM, Khuếch tán ổn định), lời nói (Thì thầm), tạo âm thanh (AudioCraft) và mô hình đa phương thức (LLaVA).

Kỹ năngMô tảĐường dẫn
audiocraft-audio-thế hệThư viện PyTorch để tạo âm thanh bao gồm chuyển văn bản thành nhạc (MusicGen) và chuyển văn bản thành âm thanh (AudioGen). Sử dụng khi bạn cần tạo nhạc từ mô tả văn bản, tạo hiệu ứng âm thanh hoặc thực hiện tạo nhạc theo giai điệu.mlops/models/audiocraft
clipMô hình kết nối tầm nhìn và ngôn ngữ của OpenAI. Cho phép phân loại hình ảnh không chụp, khớp văn bản hình ảnh và truy xuất đa phương thức. Được đào tạo về các cặp văn bản-hình ảnh 400M. Sử dụng để tìm kiếm hình ảnh, kiểm duyệt nội dung hoặc các tác vụ ngôn ngữ thị giác mà không cần tinh chỉnh. Tốt nhất cho mục đích chung…mlops/models/clip
llavaTrợ lý ngôn ngữ và tầm nhìn lớn. Cho phép điều chỉnh hướng dẫn trực quan và hội thoại dựa trên hình ảnh. Kết hợp bộ mã hóa hình ảnh CLIP với các mô hình ngôn ngữ Vicuna/LLaMA. Hỗ trợ trò chuyện nhiều lượt bằng hình ảnh, trả lời câu hỏi trực quan và hướng dẫn sau. Sử dụng cho ngôn ngữ tầm nhìn…mlops/models/llava
mô hình phân khúc-bất cứ thứ gìMô hình nền tảng cho việc phân đoạn hình ảnh với khả năng truyền không ảnh. Sử dụng khi bạn cần phân đoạn bất kỳ đối tượng nào trong hình ảnh bằng cách sử dụng các điểm, hộp hoặc mặt nạ làm lời nhắc hoặc tự động tạo tất cả các mặt nạ đối tượng trong hình ảnh.mlops/models/phân khúc-bất cứ thứ gì
ổn định-khuếch tán-hình ảnhTạo văn bản thành hình ảnh tiên tiến nhất với các mô hình Khuếch tán ổn định thông qua Bộ khuếch tán HuggingFace. Sử dụng khi tạo hình ảnh từ lời nhắc văn bản, thực hiện dịch từ hình ảnh sang hình ảnh, vẽ nội dung hoặc xây dựng quy trình khuếch tán tùy chỉnh.mlops/models/ổn định-khuếch tán
thì thầmMô hình nhận dạng giọng nói đa năng của OpenAI. Hỗ trợ 99 ngôn ngữ, phiên âm, dịch sang tiếng Anh và nhận dạng ngôn ngữ. Sáu kích thước mô hình từ nhỏ (thông số 39M) đến lớn (thông số 1550M). Sử dụng để chuyển giọng nói thành văn bản, phiên âm podcast hoặc xử lý âm thanh đa ngôn ngữ…mlops/models/thì thầm

mlop/nghiên cứu

Khung nghiên cứu ML để xây dựng và tối ưu hóa hệ thống AI bằng lập trình khai báo.

Kỹ năngMô tảĐường dẫn
dpyXây dựng các hệ thống AI phức tạp với lập trình khai báo, tự động tối ưu hóa lời nhắc, tạo các hệ thống và tác nhân RAG mô-đun với khung lập trình LM có hệ thống của DSPy - Stanford NLPmlops/nghiên cứu/dspy

mlops/huấn luyện

Tinh chỉnh, đào tạo RLHF/DPO/GRPO, khung đào tạo được phân phối và các công cụ tối ưu hóa để đào tạo LLM và các mô hình khác.

Kỹ năngMô tảĐường dẫn
axolotlHướng dẫn của chuyên gia về tinh chỉnh LLM với cấu hình Axolotl - YAML, hơn 100 mô hình, LoRA/QLoRA, DPO/KTO/ORPO/GRPO, hỗ trợ đa phương thứcmlops/training/axolotl
distributed-llm-pretraining-torchtitanCung cấp đào tạo trước LLM phân tán gốc PyTorch bằng cách sử dụng torchtitan với tính song song 4D (FSDP2, TP, PP, CP). Sử dụng khi đào tạo trước Llama 3.1, DeepSeek V3 hoặc các mô hình tùy chỉnh ở quy mô từ 8 đến 512+ GPU với Float8, torch.compile và điểm kiểm tra phân tán.mlops/training/torchtitan
tinh chỉnh-với-trlTinh chỉnh LLM bằng cách học tăng cường với TRL - SFT để điều chỉnh hướng dẫn, DPO để căn chỉnh ưu tiên, PPO/GRPO để tối ưu hóa phần thưởng và đào tạo mô hình phần thưởng. Sử dụng khi cần RLHF, điều chỉnh mô hình theo sở thích hoặc đào tạo từ phản hồi của con người. Hoạt động với HuggingFace Tr…mlops/training/trl-tinh chỉnh
grpo-rl-đào tạoHướng dẫn của chuyên gia về tinh chỉnh GRPO/RL với TRL để đào tạo mô hình lý luận và nhiệm vụ cụ thểmlops/training/grpo-rl-training
môi trường hermes-atroposXây dựng, kiểm tra và gỡ lỗi môi trường Hermes Agent RL để đào tạo Atropos. Bao gồm giao diện HermesAgentBaseEnv, các chức năng khen thưởng, tích hợp vòng lặp tác nhân, đánh giá bằng các công cụ, ghi nhật ký đũa phép và ba chế độ CLI (phục vụ/xử lý/đánh giá). Sử dụng khi tạo, đánh giá hoặc f…mlops/training/hermes-atropos-environments
ôm mặt-tăng tốcAPI đào tạo phân tán đơn giản nhất. 4 dòng để thêm hỗ trợ phân tán cho bất kỳ tập lệnh PyTorch nào. API hợp nhất cho DeepSpeed/FSDP/Megatron/DDP. Vị trí thiết bị tự động, độ chính xác hỗn hợp (FP16/BF16/FP8). Cấu hình tương tác, lệnh khởi chạy duy nhất. Tiêu chuẩn hệ sinh thái HuggingFace.mlops/huấn luyện/tăng tốc
tối ưu hóa-chú ý-flashTối ưu hóa sự chú ý của máy biến áp với Chú ý Flash để tăng tốc 2-4 lần và giảm bộ nhớ 10-20 lần. Sử dụng khi huấn luyện/chạy máy biến áp có chuỗi dài (>512 mã thông báo), gặp phải vấn đề về bộ nhớ GPU cần chú ý hoặc cần suy luận nhanh hơn. Hỗ trợ SDPA gốc PyTorch,…mlops/training/flash-chú ý
tinh chỉnh peftTinh chỉnh tham số hiệu quả cho LLM bằng các phương pháp LoRA, QLoRA và 25+. Sử dụng khi tinh chỉnh các mô hình lớn (7B-70B) có bộ nhớ GPU hạn chế, khi bạn cần huấn luyện <1% tham số với mức độ mất độ chính xác tối thiểu hoặc để phân phối nhiều bộ chuyển đổi. Thư viện chính thức của HuggingFace i…mlops/training/peft
pytorch-fsdpHướng dẫn của chuyên gia về Đào tạo song song dữ liệu được phân chia hoàn toàn với PyTorch FSDP - phân chia tham số, độ chính xác hỗn hợp, giảm tải CPU, FSDP2mlops/đào tạo/pytorch-fsdp
pytorch-sétKhung PyTorch cấp cao với lớp Huấn luyện viên, đào tạo phân tán tự động (DDP/FSDP/DeepSpeed), hệ thống gọi lại và bản soạn sẵn tối thiểu. Cân từ laptop đến siêu máy tính cùng mã. Sử dụng khi bạn muốn vòng lặp đào tạo rõ ràng với các phương pháp hay nhất được tích hợp sẵn.mlops/training/pytorch-sét
đào tạo đơn giảnTối ưu hóa tùy chọn đơn giản để căn chỉnh LLM. Giải pháp thay thế không cần tham chiếu cho DPO với hiệu suất tốt hơn (+6,4 điểm trên AlpacaEval 2.0). Không cần mô hình tham chiếu, hiệu quả hơn DPO. Sử dụng để căn chỉnh tùy chọn khi muốn đào tạo đơn giản hơn, nhanh hơn DPO/PPO.mlops/training/simpo
slime-rl-đào tạoCung cấp hướng dẫn về đào tạo sau LLM với RL bằng cách sử dụng slime, khung Megatron+SGLang. Sử dụng khi đào tạo các mô hình GLM, triển khai quy trình tạo dữ liệu tùy chỉnh hoặc cần tích hợp chặt chẽ Megatron-LM để mở rộng quy mô RL.mlops/huấn luyện/chất nhờn
unslothExpert guidance for fast fine-tuning with Unsloth - 2-5x faster training, 50-80% less memory, LoRA/QLoRA optimizationmlops/training/unsloth

mlops/vector-databases

Vector similarity search and embedding databases for RAG, semantic search, and AI application backends.

SkillDescriptionPath
chromaOpen-source embedding database for AI applications. Store embeddings and metadata, perform vector and full-text search, filter by metadata. Simple 4-function API. Scales from notebooks to production clusters. Use for semantic search, RAG applications, or document retrieval. Best…mlops/vector-databases/chroma
faissFacebook's library for efficient similarity search and clustering of dense vectors. Supports billions of vectors, GPU acceleration, and various index types (Flat, IVF, HNSW). Use for fast k-NN search, large-scale vector retrieval, or when you need pure similarity search without…mlops/vector-databases/faiss
pineconeManaged vector database for production AI applications. Fully managed, auto-scaling, with hybrid search (dense + sparse), metadata filtering, and namespaces. Low latency (<100ms p95). Use for production RAG, recommendation systems, or semantic search at scale. Best for server…mlops/vector-databases/pinecone
qdrant-vector-searchHigh-performance vector similarity search engine for RAG and semantic search. Use when building production RAG systems requiring fast nearest neighbor search, hybrid search with filtering, or scalable vector storage with Rust-powered performance.mlops/vector-databases/qdrant

note-taking

Note taking skills, to save information, assist with research, and collab on multi-session planning and information sharing.

SkillDescriptionPath
obsidianRead, search, and create notes in the Obsidian vault.note-taking/obsidian

productivity

Skills for document creation, presentations, spreadsheets, and other productivity workflows.

SkillDescriptionPath
google-workspaceGmail, Calendar, Drive, Contacts, Sheets, and Docs integration via Python. Uses OAuth2 with automatic token refresh. No external binaries needed — runs entirely with Google's Python client libraries in the Hermes venv.productivity/google-workspace
linearManage Linear issues, projects, and teams via the GraphQL API. Create, update, search, and organize issues.productivity/linear
nano-pdfEdit PDFs with natural-language instructions using the nano-pdf CLI. Modify text, fix typos, update titles, and make content changes to specific pages without manual editing.productivity/nano-pdf
notionNotion API for creating and managing pages, databases, and blocks via curl. Search, create, update, and query Notion workspaces directly from the terminal.productivity/notion
ocr-and-documentsExtract text from PDFs and scanned documents. Use web_extract for remote URLs, pymupdf for local text-based PDFs, marker-pdf for OCR/scanned docs. For DOCX use python-docx, for PPTX see the powerpoint skill.productivity/ocr-and-documents
powerpoint"Use this skill any time a .pptx file is involved in any way — as input, output, or both. This includes: creating slide decks, pitch decks, or presentations; reading, parsing, or extracting text from any .pptx file (even if the extracted content will be used elsewhere, like in a…productivity/powerpoint

research

Skills for academic research, paper discovery, literature review, domain reconnaissance, market data, content monitoring, and scientific knowledge retrieval.

SkillDescriptionPath
arxivSearch and retrieve academic papers from arXiv using their free REST API. No API key needed. Search by keyword, author, category, or ID. Combine with web_extract or the ocr-and-documents skill to read full paper content.research/arxiv
blogwatcherMonitor blogs and RSS/Atom feeds for updates using the blogwatcher CLI. Add blogs, scan for new articles, and track what you've read.research/blogwatcher
llm-wikiKarpathy's LLM Wiki — build and maintain a persistent, interlinked markdown knowledge base. Ingest sources, query compiled knowledge, and lint for consistency. Unlike RAG, the wiki compiles knowledge once and keeps it current. Works as an Obsidian vault. Configurable via skills.config.wiki.path.research/llm-wiki
domain-intelPassive domain reconnaissance using Python stdlib. Subdomain discovery, SSL certificate inspection, WHOIS lookups, DNS records, domain availability checks, and bulk multi-domain analysis. No API keys required.research/domain-intel
duckduckgo-searchFree web search via DuckDuckGo — text, news, images, videos. No API key needed. Prefer the ddgs CLI when installed; use the Python DDGS library only after verifying that ddgs is available in the current runtime.research/duckduckgo-search
ml-paper-writingWrite publication-ready ML/AI papers for NeurIPS, ICML, ICLR, ACL, AAAI, COLM. Use when drafting papers from research repos, structuring arguments, verifying citations, or preparing camera-ready submissions. Includes LaTeX templates, reviewer guidelines, and citation verificatio…research/ml-paper-writing
polymarketQuery Polymarket prediction market data — search markets, get prices, orderbooks, and price history. Read-only via public REST APIs, no API key needed.research/polymarket

red-teaming

Skills for LLM red-teaming, jailbreaking, and safety filter bypass research.

SkillDescriptionPath
godmodeJailbreak API-served LLMs using G0DM0D3 techniques — Parseltongue input obfuscation (33 techniques), GODMODE CLASSIC system prompt templates, ULTRAPLINIAN multi-model racing, encoding escalation, and Hermes-native prefill/system prompt integration. Works on any model accessible via API including closed-source models.red-teaming/godmode

smart-home

Skills for controlling smart home devices — lights, switches, sensors, and home automation systems.

SkillDescriptionPath
openhueControl Philips Hue lights, rooms, and scenes via the OpenHue CLI. Turn lights on/off, adjust brightness, color, color temperature, and activate scenes.smart-home/openhue

social-media

Skills for interacting with social platforms — posting, reading, monitoring, and account operations.

SkillDescriptionPath
xitterInteract with X/Twitter via the x-cli terminal client using official X API credentials.social-media/xitter

software-development

SkillDescriptionPath
code-reviewGuidelines for performing thorough code reviews with security and quality focussoftware-development/code-review
planPlan mode for Hermes — inspect context, write a markdown plan into .hermes/plans/ in the active workspace/backend working directory, and do not execute the work.software-development/plan
requesting-code-reviewUse when completing tasks, implementing major features, or before merging. Validates work meets requirements through systematic review process.software-development/requesting-code-review
subagent-driven-developmentUse when executing implementation plans with independent tasks. Dispatches fresh delegate_task per task with two-stage review (spec compliance then code quality).software-development/subagent-driven-development
systematic-debuggingUse when encountering any bug, test failure, or unexpected behavior. 4-phase root cause investigation — NO fixes without understanding the problem first.software-development/systematic-debugging
test-driven-developmentUse when implementing any feature or bugfix, before writing implementation code. Enforces RED-GREEN-REFACTOR cycle with test-first approach.software-development/test-driven-development
writing-plansUse when you have a spec or requirements for a multi-step task. Creates comprehensive implementation plans with bite-sized tasks, exact file paths, and complete code examples.software-development/writing-plans

Optional Skills

Optional skills ship with the repository under optional-skills/ but are not active by default. They cover heavier or niche use cases. Install them with:

hermes skills install official/<category>/<skill>

autonomous-ai-agents

SkillDescriptionPath
blackboxDelegate coding tasks to Blackbox AI CLI agent. Multi-model agent with built-in judge that runs tasks through multiple LLMs and picks the best result. Requires the blackbox CLI and a Blackbox AI API key.autonomous-ai-agents/blackbox

blockchain

SkillDescriptionPath
baseQuery Base (Ethereum L2) blockchain data with USD pricing — wallet balances, token info, transaction details, gas analysis, contract inspection, whale detection, and live network stats. Uses Base RPC + CoinGecko. No API key required.blockchain/base
solanaQuery Solana blockchain data with USD pricing — wallet balances, token portfolios with values, transaction details, NFTs, whale detection, and live network stats. Uses Solana RPC + CoinGecko. No API key required.blockchain/solana

creative

SkillDescriptionPath
blender-mcpControl Blender directly from Hermes via socket connection to the blender-mcp addon. Create 3D objects, materials, animations, and run arbitrary Blender Python (bpy) code.creative/blender-mcp
meme-generationGenerate real meme images by picking a template and overlaying text with Pillow. Produces actual .png meme files.creative/meme-generation

devops

SkillDescriptionPath
docker-managementManage Docker containers, images, volumes, networks, and Compose stacks — lifecycle ops, debugging, cleanup, and Dockerfile optimization.devops/docker-management

email

SkillDescriptionPath
agentmailGive the agent its own dedicated email inbox via AgentMail. Send, receive, and manage email autonomously using agent-owned email addresses (e.g. hermes-agent@agentmail.to).email/agentmail

health

SkillDescriptionPath
neuroskill-bciConnect to a running NeuroSkill instance and incorporate the user's real-time cognitive and emotional state (focus, relaxation, mood, cognitive load, drowsiness, heart rate, HRV, sleep staging, and 40+ derived EXG scores) into responses. Requires a BCI wearable (Muse 2/S or OpenBCI) and the NeuroSkill desktop app.health/neuroskill-bci

mcp

SkillDescriptionPath
fastmcpBuild, test, inspect, install, and deploy MCP servers with FastMCP in Python. Use when creating a new MCP server, wrapping an API or database as MCP tools, exposing resources or prompts, or preparing a FastMCP server for HTTP deployment.mcp/fastmcp

migration

SkillDescriptionPath
openclaw-migrationMigrate a user's OpenClaw customization footprint into Hermes Agent. Imports Hermes-compatible memories, SOUL.md, command allowlists, user skills, and selected workspace assets from ~/.openclaw, then reports what could not be migrated and why.migration/openclaw-migration

productivity

SkillDescriptionPath
telephonyGive Hermes phone capabilities — provision and persist a Twilio number, send and receive SMS/MMS, make direct calls, and place AI-driven outbound calls through Bland.ai or Vapi.productivity/telephony

research

SkillDescriptionPath
bioinformaticsGateway to 400+ bioinformatics skills from bioSkills and ClawBio. Covers genomics, transcriptomics, single-cell, variant calling, pharmacogenomics, metagenomics, structural biology, and more.research/bioinformatics
qmdSearch personal knowledge bases, notes, docs, and meeting transcripts locally using qmd — a hybrid retrieval engine with BM25, vector search, and LLM reranking. Supports CLI and MCP integration.research/qmd

security

SkillDescriptionPath
1passwordSet up and use 1Password CLI (op). Use when installing the CLI, enabling desktop app integration, signing in, and reading/injecting secrets for commands.security/1password
oss-forensicsSupply chain investigation, evidence recovery, and forensic analysis for GitHub repositories. Covers deleted commit recovery, force-push detection, IOC extraction, multi-source evidence collection, and structured forensic reporting.security/oss-forensics
sherlockOSINT username search across 400+ social networks. Hunt down social media accounts by username.security/sherlock