Chuyển tới nội dung chính

Tham khảo bộ công cụ

Bộ công cụ được đặt tên là các gói công cụ kiểm soát những gì tác nhân có thể làm. Chúng là cơ chế chính để định cấu hình tính khả dụng của công cụ trên mỗi nền tảng, mỗi phiên hoặc mỗi tác vụ.

Cách hoạt động của bộ công cụ

Mỗi công cụ thuộc về chính xác một bộ công cụ. Khi bạn kích hoạt một bộ công cụ, tất cả các công cụ trong gói đó sẽ có sẵn cho tổng đài viên. Bộ công cụ có ba loại:

  • Core — Một nhóm logic duy nhất gồm các công cụ liên quan (ví dụ: fileread_file, write_file, patch, search_files)
  • Tổng hợp — Kết hợp nhiều bộ công cụ cốt lõi cho một kịch bản chung (ví dụ: tệp gói gỡ lỗi, thiết bị đầu cuối và công cụ web)
  • Nền tảng — Cấu hình công cụ hoàn chỉnh cho bối cảnh triển khai cụ thể (ví dụ: hermes-cli là mặc định cho các phiên CLI tương tác)

Cấu hình bộ công cụ

Mỗi phiên (CLI)

hermes chat --toolsets web,file,terminal
hermes chat --toolsets debugging # composite — expands to file + terminal + web
hermes chat --toolsets all # everything

Trên mỗi nền tảng (config.yaml)

toolsets:
- hermes-cli # default for CLI
# - hermes-telegram # override for Telegram gateway

Quản lý tương tác

hermes tools                            # curses UI to enable/disable per platform

Hoặc trong phiên:

/tools list
/tools disable browser
/tools enable rl

Bộ công cụ cốt lõi

Bộ công cụCông cụMục đích
trình duyệtbrowser_back, browser_click, browser_console, browser_get_images, browser_navigate, browser_press, browser_scroll, browser_snapshot, browser_type, browser_vision, web_searchTự động hóa trình duyệt hoàn toàn. Bao gồm web_search làm dự phòng để tra cứu nhanh chóng.
làm rõlàm rõĐặt câu hỏi cho người dùng khi nhân viên cần làm rõ.
code_executionthực thi_codeChạy các tập lệnh Python gọi công cụ Hermes theo chương trình.
cronjobcronjobLên lịch và quản lý các nhiệm vụ định kỳ.
đoànđại biểu_taskTạo ra các phiên bản tác nhân phụ bị cô lập để thực hiện công việc song song.
tập tinpatch, read_file, search_files, write_fileĐọc, ghi, tìm kiếm và chỉnh sửa tập tin.
trợ lý gia đìnhha_call_service, ha_get_state, ha_list_entities, ha_list_servicesĐiều khiển nhà thông minh thông qua Home Assistant. Chỉ khả dụng khi HASS_TOKEN được đặt.
hình_genhình ảnh_tạoTạo văn bản thành hình ảnh thông qua FAL.ai.
ký ứcký ứcQuản lý bộ nhớ phiên chéo liên tục.
nhắn tingửi_tin nhắnGửi tin nhắn đến các nền tảng khác (Telegram, Discord, v.v.) ngay trong một phiên.
moahỗn hợp_tác nhânĐồng thuận đa mô hình thông qua Hỗn hợp các đại lý.
rlrl_check_status, rl_edit_config, rl_get_current_config, rl_get_results, rl_list_environments, rl_list_runs, rl_select_environment, rl_start_training, rl_stop_training, rl_test_inferenceQuản lý môi trường đào tạo RL (Atropos).
tìm kiếmweb_searchChỉ tìm kiếm trên web (không có trích xuất).
phiên_tìm kiếmphiên_tìm kiếmTìm kiếm các phiên trò chuyện trong quá khứ.
kỹ năngskill_manage, skill_view, skill_listKỹ năng CRUD và duyệt web.
thiết bị đầu cuốiquy trình, thiết bị đầu cuốiThực thi lệnh Shell và quản lý quy trình nền.
việc cần làmviệc cần làmQuản lý danh sách nhiệm vụ trong một phiên.
ttstext_to_speechTạo âm thanh chuyển văn bản thành giọng nói.
tầm nhìnphân tích tầm nhìnPhân tích hình ảnh thông qua các mô hình có khả năng thị giác.
webweb_extract, web_searchTìm kiếm trên web và trích xuất nội dung trang.

Bộ công cụ tổng hợp

Chúng mở rộng sang nhiều bộ công cụ cốt lõi, cung cấp cách viết tắt thuận tiện cho các tình huống phổ biến:

Bộ công cụMở rộng sangTrường hợp sử dụng
gỡ lỗipatch, process, read_file, search_files, terminal, web_extract, web_search, write_filePhiên gỡ lỗi - truy cập tệp, thiết bị đầu cuối và nghiên cứu web mà không cần chi phí trình duyệt hoặc ủy quyền.
an toànimage_generate, mixture_of_agent, vision_analyze, web_extract, web_searchNghiên cứu chỉ đọc và tạo phương tiện truyền thông. Không ghi tập tin, không truy cập thiết bị đầu cuối, không thực thi mã. Tốt cho môi trường không đáng tin cậy hoặc bị hạn chế.

Bộ công cụ nền tảng

Bộ công cụ nền tảng xác định cấu hình công cụ hoàn chỉnh cho mục tiêu triển khai. Hầu hết các nền tảng nhắn tin đều sử dụng cùng một bộ như hermes-cli:

Bộ công cụSự khác biệt từ hermes-cli
hermes-cliBộ công cụ đầy đủ - tất cả 38 công cụ bao gồm cả clarify. Giá trị mặc định cho các phiên CLI tương tác.
hermes-acpGiảm bớt clarify, cronjob, image_generate, mixture_of_agents, send_message, text_to_speech, công cụ hỗ trợ tại nhà. Tập trung vào các nhiệm vụ mã hóa trong ngữ cảnh IDE.
hermes-api-serverBỏ làm rõ, send_messagetext_to_speech. Thêm mọi thứ khác — phù hợp để truy cập theo chương trình khi không thể tương tác với người dùng.
hermes-telegramTương tự như hermes-cli.
hermes-bất hòaTương tự như hermes-cli.
hermes-slackTương tự như hermes-cli.
hermes-whatsappTương tự như hermes-cli.
hermes-tín hiệuTương tự như hermes-cli.
ma trận hermesTương tự như hermes-cli.
hermes-vật chấtTương tự như hermes-cli.
hermes-emailTương tự như hermes-cli.
hermes-smsTương tự như hermes-cli.
hermes-dingtalkTương tự như hermes-cli.
hermes-feishuTương tự như hermes-cli.
hermes-wecomTương tự như hermes-cli.
hermes-trợ lý nhàTương tự như hermes-cli.
hermes-webhookTương tự như hermes-cli.
cổng HermesLiên minh tất cả các bộ công cụ nền tảng nhắn tin. Được sử dụng nội bộ khi cổng cần bộ công cụ rộng nhất có thể.

Bộ công cụ động

Bộ công cụ máy chủ MCP

Mỗi máy chủ MCP được định cấu hình sẽ tạo ra một bộ công cụ mcp-<server> khi chạy. Ví dụ: nếu bạn định cấu hình máy chủ MCP github, bộ công cụ mcp-github sẽ được tạo có chứa tất cả các công cụ mà máy chủ hiển thị.

# config.yaml
mcp:
servers:
github:
command: npx
args: ["-y", "@modelcontextprotocol/server-github"]

Điều này tạo ra một bộ công cụ mcp-github mà bạn có thể tham khảo trong --toolsets hoặc cấu hình nền tảng.

Bộ công cụ plugin

Các plugin có thể đăng ký bộ công cụ của riêng mình thông qua ctx.register_tool() trong quá trình khởi tạo plugin. Chúng xuất hiện cùng với các bộ công cụ tích hợp sẵn và có thể được bật/tắt theo cùng một cách.

Bộ công cụ tùy chỉnh

Xác định bộ công cụ tùy chỉnh trong config.yaml để tạo các gói dành riêng cho dự án:

toolsets:
- hermes-cli
custom_toolsets:
data-science:
- file
- terminal
- code_execution
- web
- vision

Ký tự đại diện

  • all hoặc * — mở rộng cho mọi bộ công cụ đã đăng ký (tích hợp + động + plugin)

Mối quan hệ với công cụ hermes

Lệnh hermes tools cung cấp giao diện người dùng dựa trên lời nguyền để bật hoặc tắt từng công cụ riêng lẻ trên mỗi nền tảng. Điều này hoạt động ở cấp độ công cụ (tốt hơn bộ công cụ) và tồn tại ở config.yaml. Các công cụ bị vô hiệu hóa sẽ được lọc ra ngay cả khi bộ công cụ của chúng được bật.

Xem thêm: Tools Reference để biết danh sách đầy đủ các công cụ riêng lẻ và thông số của chúng.