{"data":[{"id":"nvidia-nemotron-super-3-120b-a12b","name":"nvidia-nemotron-super-3-120b-a12b","display_name":"Nemotron Super 3 120B A12B","description":"A 120B-parameter hybrid MoE Nemotron Super 3 model with 12B active parameters, optimized by NVIDIA for compute-efficient reasoning in specialized agentic systems.","creator":"nvidia","family":"nemotron_h","tier":"","version":"3","type":"language","size_in_bn":120,"modalities":{"input":["text"],"output":["text"]},"context_window":1000000,"max_output_tokens":32000,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":null,"training_data_cutoff":null,"supported_reasoning_efforts":["default"],"tokenizer":"Other","capabilities":{"function_calling":true,"parallel_function_calling":false,"structured_outputs":true,"prompt_caching":true,"reasoning":true,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":true,"adaptive_reasoning":false},"release_date":"2026-03-11","earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":3,"ids":["accounts/fireworks/models/nvidia-nemotron-3-super-120b-a12b-fp8","accounts/fireworks/models/nvidia-nemotron-3-super-120b-a12b-nvfp4","huggingface-llm-nvidia-nemotron-3-super-120b-a12b-bf16","nvidia-nemotron-3-super-120b-a12b","nvidia-nemotron-super-3-120b-a12b","nvidia/nemotron-3-super-120b-a12b","nvidia/nemotron-3-super-120b-a12b:free","nvidia/NVIDIA-Nemotron-3-Super-120B-A12B"],"hf_likes":null,"hf_downloads":null,"hf_downloads_all_time":null,"hf_trending_score":null,"updated_at":"2026-07-23 09:29:52"},{"id":"nvidia-nemotron-nano-3-30b-a3b","name":"nvidia-nemotron-nano-3-30b-a3b","display_name":"Nemotron Nano 3 30B A3B","description":"A 30B-parameter hybrid MoE Nemotron Nano 3 model with 3B active parameters, combining Mamba-Transformer architecture for efficient reasoning and agentic tasks.","creator":"nvidia","family":"nemotron_h","tier":"","version":"3","type":"language","size_in_bn":30,"modalities":{"input":["text"],"output":["text"]},"context_window":262144,"max_output_tokens":228000,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":null,"training_data_cutoff":null,"supported_reasoning_efforts":["default"],"tokenizer":"Other","capabilities":{"function_calling":true,"parallel_function_calling":false,"structured_outputs":true,"prompt_caching":false,"reasoning":true,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":true,"adaptive_reasoning":false},"release_date":"2025-12-14","earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":3,"ids":["accounts/fireworks/models/nemotron-nano-3-30b-a3b","nemotron-3-nano-30b-a3b","nvidia-nemotron-3-nano-30b-a3b","nvidia-nemotron-3-nano-30b-a3b-reasoning","nvidia-nemotron-nano-3-30b-a3b","nvidia/nemotron-3-nano-30b-a3b","nvidia/Nemotron-3-Nano-30B-A3B","nvidia/nemotron-3-nano-30b-a3b:free","nvidia/nvidia-nemotron-3-nano-30b-a3b-bf16"],"hf_likes":767,"hf_downloads":1129029,"hf_downloads_all_time":6131226,"hf_trending_score":8,"updated_at":"2026-07-23 09:29:52"},{"id":"nvidia-nemotron-3-ultra","name":"nemotron-3-ultra","display_name":"Nemotron 3 Ultra","description":"A frontier-scale Nemotron large language model from NVIDIA designed for strong agentic, reasoning, and conversational capabilities at extreme parameter counts.","creator":"nvidia","family":"nemotron_h","tier":"ultra","version":"3","type":"language","size_in_bn":null,"modalities":{"input":["text"],"output":["text"]},"context_window":null,"max_output_tokens":null,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":null,"training_data_cutoff":null,"supported_reasoning_efforts":[],"tokenizer":null,"capabilities":{"function_calling":false,"parallel_function_calling":false,"structured_outputs":false,"prompt_caching":false,"reasoning":false,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":false,"adaptive_reasoning":false},"release_date":null,"earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":1,"ids":["accounts/fireworks/models/nemotron-3-ultra-bf16","accounts/fireworks/models/nemotron-3-ultra-nvfp4","nvidia-nemotron-3-ultra"],"hf_likes":null,"hf_downloads":null,"hf_downloads_all_time":null,"hf_trending_score":null,"updated_at":"2026-07-23 09:29:52"},{"id":"nvidia-nemotron-nano-2-12b","name":"nemotron-nano-2-12b","display_name":"Nemotron Nano 2 12B","description":"A 12B-parameter hybrid LLM from NVIDIA's Nemotron Nano v2 series, trained from scratch as a unified model supporting both reasoning and non-reasoning modes.","creator":"nvidia","family":"nemotron_h","tier":"","version":"2","type":"language","size_in_bn":12,"modalities":{"input":["image","text"],"output":["text"]},"context_window":131072,"max_output_tokens":8192,"tool_use_system_prompt_tokens":0,"output_vector_sizes":[],"knowledge_cutoff":null,"training_data_cutoff":null,"supported_reasoning_efforts":[],"tokenizer":null,"capabilities":{"function_calling":false,"parallel_function_calling":false,"structured_outputs":false,"prompt_caching":false,"reasoning":false,"web_search":false,"computer_use":false,"code_execution":false,"file_search":false,"url_context":false,"assistant_prefill":false,"native_structured_output":false,"adaptive_reasoning":false},"release_date":"2025-12-02","earliest_deprecation_date":null,"deprecated":false,"has_pricing":true,"provider_count":2,"ids":["accounts/fireworks/models/nvidia-nemotron-nano-12b-v2","fireworks_ai/accounts/fireworks/models/nvidia-nemotron-nano-12b-v2","huggingface-reasoning-nvidia-nemotron-nano-12b-v2","nvidia-nemotron-nano-2-12b","nvidia.nemotron-nano-12b-v2"],"hf_likes":null,"hf_downloads":null,"hf_downloads_all_time":null,"hf_trending_score":null,"updated_at":"2026-07-23 09:29:52"}],"pagination":{"page_size":50,"has_next":false,"next_token":null,"total_count":4},"meta":{"updated_at":"2026-07-23","request_id":"bdb0df47-6ba6-48eb-a715-16ba5216c3ab","execution_ms":1}}