MediaProfesi.id
  • Fokus Utama
  • Nasional
  • Ekonomi
  • Profil
  • Teknologi
  • Sosialita
  • Gaya Hidup
  • Video
Kamis, 4 Juni 2026
No Result
View All Result
  • Fokus Utama
  • Nasional
  • Ekonomi
  • Profil
  • Teknologi
  • Sosialita
  • Gaya Hidup
  • Video
Kamis, 4 Juni 2026
No Result
View All Result
MediaProfesi.id
No Result
View All Result
Home Teknologi

Red Hat Akan Menghadirkan Peningkatan Inferensi AI di AWS

Syamhudi by Syamhudi
Jumat, 12 Desember 2025
in Teknologi
Red Hat Akan Menghadirkan Peningkatan Inferensi AI di AWS
12
VIEWS

Jakarta, Mediaprofesi.id – Red Hat, penyedia solusi open source terkemuka di dunia, baru-baru ini mengumumkan kolaborasinya yang makin luas dengan Amazon Web Services (AWS) untuk memperkuat AI generatif (gen AI) kelas enterprise di AWS melalui Red Hat AI dan silikon AI dari AWS.

Melalui kolaborasi ini, Red Hat berfokus pada pemberdayaan pengambil keputusan IT dengan fleksibilitas untuk menjalankan inferensi AI berkinerja tinggi dan efisien pada skala besar, terlepas dari hardware yang digunakan.

Joe Fernandes, vice president and general manager, AI Business Unit, Red Hat mengatakan, “Dengan mengaktifkan Red Hat AI Inference Server kelas enterprise kami, yang dibangun di atas kerangka kerja vLLM yang inovatif, menggunakan chip AI AWS, kami memberdayakan organisasi untuk mengimplementasikan dan meningkatkan beban kerja AI dengan efisiensi dan fleksibilitas yang makin meningkat. Dengan memanfaatkan warisan open source Red Hat, kolaborasi ini bertujuan untuk menjadikan AI generatif lebih mudah diakses dan lebih hemat biaya di seluruh lingkungan hybrid cloud.”

Meningkatnya penggunaan gen AI dan kebutuhan akan inferensi yang dapat diskalakan mendorong organisasi untuk mengevaluasi kembali infrastruktur IT mereka. Akibatnya, IDC memprediksi bahwa “pada tahun 2027, 40% organisasi akan menggunakan custom silicon, termasuk prosesor ARM atau chip khusus AI/ML, untuk memenuhi peningkatan permintaan terhadap optimalisasi kinerja, efisiensi biaya, dan komputasi khusus.

Hal ini menegaskan adanya kebutuhan akan solusi yang dioptimalkan untuk meningkatkan daya komputasi, meminimalkan biaya, dan memungkinkan siklus inovasi yang lebih cepat bagi aplikasi AI berkinerja tinggi.

Colin Brace, vice president, Annapurna Labs, AWS menyatakan, “Perusahaan menuntut solusi yang menawarkan kinerja luar biasa, efisiensi biaya, dan pilihan operasional untuk beban kerja AI yang sangat penting. AWS merancang chip Trainium dan Inferentia untuk membuat inferensi dan training AI berkinerja tinggi lebih mudah diakses dan lebih hemat biaya. Kolaborasi kami dengan Red Hat memberikan pelanggan jalur yang terus kami support untuk menerapkan AI generatif dalam skala besar, menggabungkan fleksibilitas open source dengan infrastruktur AWS dan akselerator AI yang dibuat khusus, untuk mempercepat time-to-value dari tahap uji coba hingga ke tahap produksi.”

Kerja sama Red Hat dengan AWS memberdayakan organisasi dengan strategi gen AI full-stack dengan menyatukan kapabilitas platform komprehensif Red Hat dengan infrastruktur cloud dan chipset AI dari AWS, yaitu AWS Inferentia2 dan AWS Trainium3. Aspek-aspek utama dari kolaborasi ini meliputi:

  • Red Hat AI Inference Server pada chip AI AWS: Red Hat AI Inference Server, yang didukung oleh vLLM, akan diaktifkan dengan chip AI AWS, termasuk AWS Inferentia2 dan AWS Trainium3, guna menghadirkan lapisan inferensi umum yang dapat mendukung model gen AI apa pun. Hal ini membantu pelanggan mencapai kinerja lebih tinggi, latensi lebih rendah, dan efisiensi biaya untuk skalabilitas penerapan AI di tahap produksi, dengan peningkatan harga dan kinerja hingga 30–40% lebih baik dibandingkan instance Amazon EC2 berbasis GPU yang sebanding saat ini.
  • Mengaktifkan AI pada Red Hat OpenShift: Red Hat bekerja sama dengan AWS untuk mengembangkan operator AWS Neuron untuk Red Hat OpenShift, Red Hat OpenShift AI, dan Red Hat OpenShift Service on AWS, sebuah platform aplikasi yang komprehensif dan sepenuhnya dikelola di AWS, sehingga menyediakan jalur yang lebih mulus kepada pelanggan dan mendukung pelanggan dalam menjalankan beban kerja AI mereka menggunakan akselerator AWS.
  • Kemudahan akses dan implementasi: Dengan mendukung chip AI AWS, Red Hat akan menawarkan akses yang lebih mudah dan lebih optimal ke akselerator berkapasitas tinggi dan sangat diminati saat ini untuk pelanggan Red Hat di AWS. Selain itu, Red Hat baru-baru ini merilis amazon.ai Certified Ansible Collection untuk Red Hat Ansible Automation Platform untuk memfasilitasi orkestrasi layanan AI di AWS.
  • Kontribusi komunitas hulu (upstream): Red Hat dan AWS bekerja sama untuk mengoptimalkan plugin chip AI AWS yang yang di-upstream-kan ke vLLM. Sebagai kontributor komersial teratas untuk vLLM, Red Hat berkomitmen untuk memfasilitiasi penggunaan vLLM di AWS untuk membantu mempercepat kapabilitas inferensi dan training AI bagi pengguna. vLLM juga merupakan fondasi dari llm-d, proyek open source yang berfokus pada penyediaan inferensi berskala besar dan kini tersedia sebagai fitur yang didukung secara komersial di Red Hat OpenShift AI 3.

Red Hat memiliki sejarah panjang dalam berkolaborasi dengan AWS untuk memberdayakan pelanggan mulai dari pusat data hingga edge. Tonggak pencapaian terbaru ini bertujuan untuk menjawab kebutuhan organisasi yang terus berkembang ketika mereka mengintegrasikan AI ke dalam strategi hybrid cloud guna mencapai hasil gen AI yang optimal dan efisien.

Jean-François Gamache, chief information officer and vice president, Digital Services, CAE mengatakan, “Modernisasi aplikasi-aplikasi penting kami dengan Red Hat OpenShift Service on AWS menandai tonggak penting dalam transformasi digital kami. Platform ini mendukung para pengembang kami dalam berfokus pada inisiatif bernilai tinggi—mendorong inovasi produk dan mempercepat integrasi AI di seluruh solusi kami. Red Hat OpenShift memberikan fleksibilitas dan skalabilitas yang memungkinkan kami memberikan dampak nyata, mulai dari insight yang dapat ditindaklanjuti melalui coaching virtual langsung hingga secara signifikan mempercepat waktu penyelesaian untuk masalah yang dilaporkan pengguna.”

Sementara Anurag Agrawal, founder and chief global analyst, Techaisle mengungkapkan, “Seiring dengan meningkatnya biaya inferensi AI, perusahaan semakin memprioritaskan efisiensi sekaligus kinerja. Kolaborasi ini mencerminkan strategi ‘any model, any hardware’ di Red Hat dengan menggabungkan platform open hybrid cloud mereka dengan keunggulan ekonomi dari AWS Trainium dan Inferentia. Hal ini memberdayakan CIO untuk mengimplementasikan AI generatif dalam skala besar, beralih dari eksperimen yang mahal ke tahap produksi yang berkelanjutan dan terkelola.” * (Syam)

Post Views181 Views
Tags: AI generatif (gen AI)Amazon Web Services (AWS)Red HatRed Hat AIsilikon AI

Related Posts

Red Hat Bongkar Rahasia AI Masa Depan: Agen AI Kini Bisa Jadi “Superuser”
Teknologi

Red Hat Bongkar Rahasia AI Masa Depan: Agen AI Kini Bisa Jadi “Superuser”

by Pratama
Kamis, 21 Mei 2026
18
Red Hat OpenShift Kini Tersedia di Konsol Google Cloud
Teknologi

Red Hat OpenShift Kini Tersedia di Konsol Google Cloud

by Wahyu
Rabu, 1 April 2026
17

RECOMMENDED

Berawal dari Radang Tenggorokan, Ribuan Siswa SD Akan Disaring, YJI Bongkar Ancaman Jantung Rematik yang Sering Tak Bergejala

Berawal dari Radang Tenggorokan, Ribuan Siswa SD Akan Disaring, YJI Bongkar Ancaman Jantung Rematik yang Sering Tak Bergejala

3 Juni 2026
27
Spa, Yoga, Fitness hingga AI Body Reading, Konsep Wellness Terintegrasi Ini Sedang Jadi Perbincangan di Bali

Spa, Yoga, Fitness hingga AI Body Reading, Konsep Wellness Terintegrasi Ini Sedang Jadi Perbincangan di Bali

3 Juni 2026
26

MOST VIEWED

  • Biaya Haji Musim 2023 Diusulkan Naik Menjadi Rp69 Juta per Jemaah Haji, Ini Alasan Menag

    Biaya Haji Musim 2023 Diusulkan Naik Menjadi Rp69 Juta per Jemaah Haji, Ini Alasan Menag

    572 shares
    Share 229 Tweet 143
  • Dokter Phedy Memiliki Keahlian Menangani Berbagai Masalah Tulang Belakang

    368 shares
    Share 147 Tweet 92
  • Mengawali Tahun 2023, Sharp Luncurkan LED TV Aquos IIOTO Series Terbaru

    361 shares
    Share 144 Tweet 90
  • Dable Terbitkan ‘Digital Media Landscape 2021’, Termasuk TOP 30 Media di Indonesia

    327 shares
    Share 131 Tweet 82
  • Kementerian Agama Buka Seleksi Petugas Haji 2023, Syarat Utama Wajib Penguasaan IT

    327 shares
    Share 131 Tweet 82
MediaProfesi.id

MediaProfesi menyediakan berita aktual

CATEGORY

  • Ekonomi
  • Gaya Hidup
  • Nasional
  • Profil
  • Sosialita
  • Teknologi

Copyright © 2025 MediaProfesi.id - Design & Developed by XUANTUM

No Result
View All Result
  • Fokus Utama
  • Nasional
  • Ekonomi
  • Profil
  • Teknologi
  • Gaya Hidup
  • Sosialita

Copyright © 2025 MediaProfesi.id - Design & Developed by XUANTUM