AMD เสนอความเป็นผู้นำด้านโซลูชั่น AI ณ งาน Advancing AI 2024

Insight Her

1 ปี ago

AMD (NASDAQ: AMD) ประกาศเปิดตัวโซลูชันการประมวลผลประสิทธิภาพสูงรุ่นล่าสุด เพื่อกำหนดนิยามของยุคแห่งการประมวลผลด้าน AI ประกอบด้วยโปรเซสเซอร์สำหรับเซิร์ฟเวอร์ 5th Gen AMD EPYC™, กราฟิกการ์ด AMD Instinct™ MI325X, ชิปหน่วยประมวลผลข้อมูล AMD Pensando™ Salina DPUs, AMD Pensando Pollara 400 NICs และโมบายโปรเซสเซอร์ AMD Ryzen™ AI PRO 300 series สำหรับโซลูชั่น AI ระดับองค์กร

AMD และพันธมิตร ยังได้นำเสนอการใช้งานโซลูชัน AI ของ AMD ในระดับองค์กร การเติบโตอย่างต่อเนื่องของระบบนิเวศซอฟต์แวร์ AI โอเพ่นซอร์สบน AMD ROCm™ และกลุ่มผลิตภัณฑ์ใหม่ที่หลากหลายบนพื้นฐานผลิตภัณฑ์กราฟิกการ์ด AMD Instinct, โปรเซสเซอร์ EPYC และโปรเซสเซอร์ Ryzen PRO

ดร.ลิซ่า ซู ประธานและซีอีโอ บริษัท AMD กล่าวว่า “ดาต้าเซ็นเตอร์และ AI เป็นโอกาสเติบโตที่สำคัญสำหรับ AMD และเรากำลังสร้างโมเมนตัมที่แข็งแกร่งสำหรับโปรเซสเซอร์ EPYC และกราฟิกการ์ด AMD Instinct ของเราในกลุ่มลูกค้าที่เพิ่มขึ้น ด้วยผลิตภัณฑ์ใหม่โปรเซสเซอร์ AMD EPYC กราฟิกการ์ด AMD Instinct และ Pensando DPUs เรากำลังส่งมอบเทคโนโลยีการประมวลผลระดับผู้นำเพื่อขับเคลื่อนเวิร์คโหลดงานที่สำคัญและมีความต้องการสูงที่สุดให้กับลูกค้าของเรา เมื่อมองไปในอนาคต เราเห็นว่าตลาดกราฟิกการ์ด AI สำหรับดาต้าเซ็นเตอร์จะเติบโตถึง 5 แสนล้านดอลลาร์ภายในปี 2028 เรามุ่งมั่นทุ่มเทเพื่อส่งมอบนวัตกรรมแบบเปิดผ่านโซลูชันระดับซิลิคอน ซอฟต์แวร์ เครือข่าย และคลัสเตอร์ของ AMD”

การกำหนดนิยามของดาต้าเซ็นเตอร์ในยุค AI

AMD ได้ประกาศเปิดตัวกลุ่มผลิตภัณฑ์ดาต้าเซ็นเตอร์สำหรับ AI ระดับองค์กร คลาวด์ และการผสานรวมงานที่หลากหลาย

โปรเซสเซอร์ AMD EPYC 9005 Series ใหม่ มอบประสิทธิภาพการประมวลผลในระดับที่สามารถทำลายสถิติ [1] เพื่อเปิดใช้งานโซลูชันด้านการประมวลผลที่ได้รับการคำนวณให้เหมาะสมสำหรับความต้องการของดาต้าเซ็นเตอร์ที่หลากหลาย สร้างขึ้นบนสถาปัตยกรรม “Zen 5” รุ่นล่าสุด มาพร้อมคอร์ประมวลผลสูงสุด 192 คอร์ และจะวางจำหน่ายบนแพลตฟอร์มที่หลากหลายผ่าน OEM และ ODM ชั้นนำ ตั้งแต่วันนี้เป็นต้นไป
AMD ยังคงดำเนินการตามแผนการเปิดตัวผลิตภัณฑ์กราฟิกการ์ด AI ประจำปี ผ่านการเปิดตัวผลิตภัณฑ์กราฟิกการ์ด AMD Instinct MI325X มอบประสิทธิภาพการประมวลผลและหน่วยความจำระดับชั้นนำสำหรับงานด้าน AI ที่ต้องการประสิทธิภาพสูงสุด โดย AMD ได้แชร์รายละเอียดใหม่ของกราฟิกการ์ด AMD Instinct MI350 series รุ่นต่อไป ซึ่งคาดว่าจะเปิดตัวในช่วงครึ่งหลังของปี 2025 โดยขยายความจุหน่วยความจำและประสิทธิภาพด้าน generative AI บน AMD Instinct นอกจากนี้ AMD ยังมีความคืบหน้าอย่างมากในการพัฒนากราฟิกการ์ด AMD Instinct MI400 Series บนสถาปัตยกรรม AMD CDNA Next โดยวางแผนจะวางจำหน่ายในปี 2026
AMD ได้พัฒนาชุดซอฟต์แวร์ AMD ROCm อย่างต่อเนื่อง ทำให้ประสิทธิภาพการอนุมานและการเรียนรู้บนกราฟิกการ์ด AMD Instinct MI300X เพิ่มขึ้นเป็นสองเท่า [2] ในโมเดลด้าน AI ที่กำลังได้รับความนิยมมากที่สุด ปัจจุบัน มีโมเดลมากกว่าหนึ่งล้านโมเดลที่ทำงานได้อย่างราบรื่นบนกราฟิกการ์ด AMD Instinct ซึ่งเพิ่มขึ้นถึงสามเท่าของจำนวนที่เปิดตัว MI300X โดยมาพร้อมการรองรับบนโมเดลต่าง ๆ ที่ใช้กันอย่างแพร่หลาย
AMD ได้ขยายกลุ่มผลิตภัณฑ์เครือข่ายประสิทธิภาพสูงเพื่อตอบสนองความต้องการด้านระบบเครือข่ายที่เปลี่ยนแปลงไปสำหรับโครงสร้างพื้นฐาน AI โดยเพิ่มประสิทธิภาพการประมวลผลของโปรเซสเซอร์ และกราฟิกการ์ดสูงสุด เพื่อมอบประสิทธิภาพ ความสามารถในการปรับขนาดเวิร์คโหลด และประสิทธิภาพทั่วทั้งระบบ ชิปหน่วยประมวลผลข้อมูล AMD Pensando Salina DPU มอบเครือข่ายส่วนหน้า (front-end) ประสิทธิภาพสูงสำหรับระบบ AI ในขณะที่ AMD Pensando Pollara 400 ซึ่งเป็นผลิตภัณฑ์กลุ่ม NIC ที่รองรับ Ultra Ethernet Consortium ช่วยลดความซับซ้อนของการปรับแต่งประสิทธิภาพและยกระดับเวลาในการผลิตให้ดียิ่งขึ้น

พันธมิตรของ AMD ได้นำเสนอว่าพวกเขาใช้โซลูชันดาต้าเซ็นเตอร์ของ AMD ในการขับเคลื่อนความเป็นผู้นำด้าน generative AI มอบโครงสร้างพื้นฐานระบบคลาวด์ที่ใช้งานโดยผู้คนหลายล้านคนต่อวัน และขับเคลื่อนดาต้าเซ็นเตอร์แบบออน-เพรเมิส (on-prem) และแบบไฮบริดให้กับองค์กรชั้นนำต่าง ๆ

นับตั้งแต่เปิดตัวในเดือนธันวาคม 2023 กราฟิกการ์ด AMD Instinct MI300X มีการใช้งานอย่างแพร่หลายผ่านพันธมิตรชั้นนำด้านระบบคลาวด์ OEM และ ODM และกำลังให้บริการผู้ใช้หลายล้านคนต่อวันบนโมเดล AI ที่ได้รับความนิยม เช่น OpenAI’s ChatGPT, Meta Llama และมากกว่าหนึ่งล้านโมเดลโอเพ่นซอร์สบนแพลตฟอร์ม Hugging Face
Google ได้เน้นย้ำถึงวิธีการที่โปรเซสเซอร์ AMD EPYC ขับเคลื่อนบนอินสแตนซ์ที่หลากหลายสำหรับงานด้าน AI, การประมวลผลประสิทธิภาพสูง, การประมวลผลทั่วไป และการประมวลผลที่เป็นความลับขั้นสูง รวมถึง AI Hypercomputer สถาปัตยกรรมซูเปอร์คอมพิวเตอร์ที่ออกแบบมาเพื่อเพิ่มผลตอบแทนจากการลงทุนด้าน AI สูงสุด Google ยังได้ประกาศว่า VM ที่ใช้โปรเซสเซอร์ EPYC 9005 Series จะพร้อมวางจำหน่ายในช่วงต้นปี 2025
Oracle Cloud Infrastructure ได้แชร์วิธีการใช้ประโยชน์จากโปรเซสเซอร์ AMD EPYC, กราฟิกการ์ด AMD Instinct และ Pensando DPUs เพื่อมอบการประมวลผลและโครงสร้างพื้นฐานเครือข่ายที่รวดเร็วและประหยัดพลังงานให้กับลูกค้า เช่น Uber, Red Bull Powertrains, PayPal และ Fireworks AI โดย OCI ได้ประกาศเปิดตัวแพลตฟอร์มการประมวลผล E6 ใหม่ที่ขับเคลื่อนขุมพลังการประมวลผลบนโปรเซสเซอร์ EPYC 9005
Databricks เน้นย้ำว่าโมเดลและเวิร์กโฟลว์ทำงานได้อย่างราบรื่นบนกราฟิกการ์ด AMD Instinct และ ROCm พร้อมเปิดเผยว่าจากการทดสอบแสดงให้เห็นว่าความจุหน่วยความจำขนาดใหญ่และความสามารถในการประมวลผลของ AMD Instinct MI300X GPUs ช่วยเพิ่มประสิทธิภาพขึ้นมากกว่า 50% ใน Llama และโมเดลเฉพาะของ Databricks
สัตยา นาเดลลา ซีอีโอบริษัท Microsoft ย้ำถึงความร่วมมือและการสร้างสรรค์ร่วมกันมาอย่างยาวนานระหว่าง Microsoft และ AMD ในผลิตภัณฑ์และโครงสร้างพื้นฐานของ Microsoft โดย MI300X มอบประสิทธิภาพที่แข็งแกร่งบนเวิร์คโหลด Microsoft Azure และ GPT นอกจากนี้ เขาและดร.ซู ยังได้หารือเกี่ยวกับความร่วมมือเชิงลึกของบริษัททั้งสองเกี่ยวกับแผนการพัฒนา AMD Instinct และวิธีที่ Microsoft จะใช้ประโยชน์จากกราฟิกการ์ด AMD Instinct รุ่นต่อไป รวมถึง MI350 series และรุ่นต่อ ๆ ไป เพื่อมอบประสิทธิภาพต่อดอลลาร์ต่อวัตต์ในระดับผู้นำสำหรับแอปพลิเคชันด้าน AI
Meta อธิบายถึงรายละเอียดกระบวนการที่โปรเซสเซอร์ AMD EPYC และกราฟิกการ์ด AMD Instinct ขับเคลื่อนโครงสร้างพื้นฐานการประมวลผลในงานและบริการด้าน AI โดย MI300X ให้บริการการรับส่งข้อมูลแบบเรียลไทม์ทั้งหมดบน Llama 405B นอกจากนี้ Meta ยังจับมือเป็นพันธมิตรกับ AMD เพื่อเพิ่มประสิทธิภาพ AI ทั้งในระดับซิลิคอน ระบบ เครือข่าย ไปจนถึงซอฟต์แวร์และแอปพลิเคชัน
บริษัทชั้นนำอย่าง Dell, HPE, Lenovo และ Supermicro กำลังขยายกลุ่มผลิตภัณฑ์ประสิทธิภาพสูงและประหยัดพลังงานบนขุมพลังโปรเซสเซอร์ AMD EPYC ด้วยแพลตฟอร์มใหม่ที่ออกแบบมาเพื่อทำให้ดาต้าเซ็นเตอร์ทันสมัยสำหรับยุค AI

AMD ขยายอีโคซิสเต็มด้าน Open AI

AMD ยังคงลงทุนในอีโคซิสเต็มด้าน AI แบบเปิดและขยายซอฟต์แวร์โอเพ่นซอร์ส AMD ROCm ด้วยฟีเจอร์ เครื่องมือ การเพิ่มประสิทธิภาพ และการสนับสนุนใหม่ ๆ เพื่อช่วยให้ผู้พัฒนาสามารถดึงประสิทธิภาพได้สูงสุดจากกราฟิกการ์ด AMD Instinct และมอบการรองรับโมเดลด้าน AI ชั้นนำในปัจจุบัน โดยผู้นำธุรกิจด้าน AI อย่าง Essential AI, Fireworks AI, Luma AI และ Reka AI ได้หารือถึงวิธีการเพิ่มประสิทธิภาพบนโมเดลต่าง ๆ ทั้งบนฮาร์ดแวร์และซอฟต์แวร์ของ AMD

นอกจากนี้ AMD ยังได้จัดกิจกรรมสำหรับนักพัฒนา ซึ่งมีผู้นำด้านเทคนิคจากอีโคซิสเต็มนักพัฒนา AI เข้าร่วม เช่น Microsoft, OpenAI, Meta, Cohere, xAI และบริษัทชั้นนำอื่น ๆ มากมาย โดยมีผู้บรรยายชื่อดังซึ่งเป็นผู้ประดิษฐ์ภาษาการเขียนโปรแกรม โมเดล และเฟรมเวิร์ก AI ที่สำคัญต่อการปฎิรูปอุตสาหกรรม AI เช่น Triton, TensorFlow, vLLM และ Paged Attention, FastChat และอื่น ๆ อีกมากมาย ซึ่งได้มาแชร์วิธีที่นักพัฒนาปลดล็อกการเพิ่มประสิทธิภาพ AI ผ่านภาษาการเขียนโปรแกรมที่ไม่ขึ้นกับผู้ขายหรือผู้จัดจำหน่าย การเร่งความเร็วการประมวลผลโมเดลบนกราฟิกการ์ด AMD Instinct และการเน้นย้ำถึงความสะดวกในการพอร์ตไปยังซอฟต์แวร์ ROCm และวิธีที่อีโคซิสเต็มกำลังได้รับประโยชน์จากแนวทางโอเพ่นซอร์ส

เพิ่มประสิทธิภาพการทำงานในระดับองค์กรด้วย AI PC

AMD เปิดตัวโปรเซสเซอร์ AMD Ryzen AI PRO 300 Series ซึ่งเป็นโปรเซสเซอร์ที่ขับเคลื่อนขุมพลังการประมวลผลให้กับแล็ปท็อป Microsoft Copilot+ ตัวแรกที่เปิดใช้งานสำหรับองค์กร [3] กลุ่มผลิตภัณฑ์โปรเซสเซอร์ Ryzen AI PRO 300 Series ขยายความเป็นผู้นำของ AMD ด้านประสิทธิภาพการประมวลผลและอายุการใช้งานแบตเตอรี่ พร้อมด้วยฟีเจอร์ด้านความปลอดภัยและการจัดการระดับองค์กรสำหรับผู้ใช้งานทางธุรกิจ

โปรเซสเซอร์ AMD Ryzen AI PRO 300 Series ใช้สถาปัตยกรรม AMD “Zen 5” และ AMD XDNA™ 2 ใหม่ เป็นโปรเซสเซอร์เชิงพาณิชย์ที่ล้ำสมัยที่สุดในโลก [4] มอบประสิทธิภาพการประมวลผลที่ดีที่สุดในกลุ่มผลิตภัณฑ์ระดับเดียวกันเพื่อผลิตผลงานที่ยกระดับไปอีกขั้น [5] และประสิทธิภาพด้าน AI ระดับ 55 NPU TOPS [6] ซึ่งเป็นประสิทธิภาพระดับชั้นนำของอุตสาหกรรม บนโปรเซสเซอร์ Ryzen AI 9 HX PRO 375 เพื่อประมวลผลงานด้าน AI บนเครื่องแล็ปท็อป Ryzen AI PRO
Microsoft เน้นว่า Windows 11 Copilot+ และกลุ่มผลิตภัณฑ์โปรเซสเซอร์ Ryzen AI PRO 300 พร้อมแล้วสำหรับประสบการณ์ด้าน AI รุ่นต่อไป รวมถึงฟีเจอร์ใหม่ด้านประสิทธิภาพการผลิตและความปลอดภัย
พันธมิตร OEM อย่าง HP และ Lenovo กำลังขยายข้อเสนอเชิงพาณิชย์ด้วยกลุ่มผลิตภัณฑ์คอมพิวเตอร์ใหม่ที่ขับเคลื่อนขุมพลังการประมวลผลบนโปรเซสเซอร์ Ryzen AI PRO 300 Series โดยคาดว่าจะมีแพลตฟอร์มมากกว่า 100 แพลตฟอร์มที่จะออกสู่ตลาดภายในปี 2025

[1] EPYC-022F: For a complete list of world records see: amd.com/worldrecords
[2] Testing conducted by internal AMD Performance Labs as of September 29, 2024 inference performance comparison between ROCm 6.2 software and ROCm 6.0 software on the systems with 8 AMD Instinct™ MI300X GPUs coupled with Llama 3.1-8B, Llama 3.1-70B, Mixtral-8x7B, Mixtral-8x22B, and Qwen 72B models.
ROCm 6.2 with vLLM 0.5.5 performance was measured against the performance with ROCm 6.0 with vLLM 0.3.3, and tests were performed across batch sizes of 1 to 256 and sequence lengths of 128 to 2048.
Configurations:
1P AMD EPYC™ 9534 CPU server with 8x AMD Instinct™ MI300X (192GB, 750W) GPUs, Supermicro AS-8125GS-TNMR2, NPS1 (1 NUMA per socket), 1.5 TiB (24 DIMMs, 4800 mts memory, 64 GiB/DIMM), 4x 3.49TB Micron 7450 storage, BIOS version: 1.8, , ROCm 6.2.0-00, vLLM 0.5.5, PyTorch 2.4.0, Ubuntu® 22.04 LTS with Linux kernel 5.15.0-119-generic.
vs.
1P AMD EPYC 9534 CPU server with 8x AMD Instinct™ MI300X (192GB, 750W) GPUs, Supermicro AS-8125GS-TNMR2, NPS1 (1 NUMA per socket), 1.5TiB 24 DIMMS, 4800 mts memory, 64 GiB/DIMM), 4x 3.49TB Micron 7450 storage, BIOS version: 1.8, ROCm 6.0.0-00, vLLM 0.3.3, PyTorch 2.1.1, Ubuntu 22.04 LTS with Linux kernel 5.15.0-119-generic. MI300-62
Server manufacturers may vary configurations, yielding different results. Performance may vary based on factors including but not limited to different versions of configurations, vLLM, and drivers.
[3] Based on Microsoft Copilot+ requirements of minimum 40 TOPS using AMD product specifications and competitive products announced as of Oct 2024. Microsoft requirements found here – https://support.microsoft.com/en-us/topic/copilot-pc-hardware-requirements-35782169-6eab-4d63-a5c5-c498c3037364. STXP-05.
[4] Based on a small node size for an x86 platform and cutting-edge, interconnected technologies, as of September 2024. GD-203b
[5] Testing as of Sept 2024 by AMD performance labs using the following systems: HP EliteBook X G1a with AMD Ryzen AI 9 HX PRO 375 processor @40W, Radeon™ 890M graphics, 32GB of RAM, 512GB SSD, VBS=ON, Windows 11 Pro; Lenovo ThinkPad T14s Gen 6 with AMD Ryzen™ AI 7 PRO 360 processor @22W, Radeon™ 880M graphics, 32GB RAM, 1TB SSD, VBS=ON, Windows 11 Pro; Dell Latitude 7450 with Intel Core Ultra 7 165U processor @15W (vPro enabled), Intel Iris Xe Graphics, VBS=ON, 32GB RAM, 512GB NVMe SSD, Microsoft Windows 11 Professional; Dell Latitude 7450 with Intel Core Ultra 7 165H processor @28W (vPro enabled), Intel Iris Xe Graphics, VBS=ON, 16GB RAM, 512GB NVMe SSD, Microsoft Windows 11 Pro. The following applications were tested in Balanced Mode: Teams + Procyon Office Productivity, Teams + Procyon Office Productivity Excel, Teams + Procyon Office Productivity Outlook, Teams + Procyon Office Productivity Power Point, Teams + Procyon Office Productivity Word, Composite Geomean Score. Each Microsoft Teams call consists of 9 participants (3X3). Laptop manufactures may vary configurations yielding different results. STXP-10.
Testing as of Sept 2024 by AMD performance labs using the following systems: (1) Lenovo ThinkPad T14s Gen 6 with an AMD Ryzen™ AI 7 PRO 360 processor (@22W), Radeon™ 880M graphics, 32GB RAM, 1TB SSD, VBS=ON, Windows 11 Pro; (2) Dell Latitude 7450 with Intel Core Ultra 7 165U processor (@15W) (vPro enabled), Intel Iris Xe Graphics, VBS=ON, 32GB RAM, 512GB NVMe SSD, Microsoft Windows 11 Professional; and (3) Dell Latitude 7450 with Intel Core Ultra 7 165H processor (@28W) (vPro enabled), Intel Arc Graphics, VBS=ON, 16GB RAM, 512GB NVMe SSD, Microsoft Windows 11 Pro. Tested applications (in Balanced Mode) include: Procyon Office Productivity, Procyon Office Productivity Excel, Procyon Office Productivity Outlook, Procyon Office Productivity Power Point, Procyon Office Productivity Word, Composite Geomean Score. Laptop manufactures may vary configurations yielding different results. STXP-11.
[6] Trillions of Operations per Second (TOPS) for an AMD Ryzen processor is the maximum number of operations per second that can be executed in an optimal scenario and may not be typical. TOPS may vary based on several factors, including the specific system configuration, AI model, and software version. GD-243.

▶︎ อัปเดตข่าวสาร และบทความต่างๆ
คลิกดูต่อที่ insight-daily.com ได้เลย!

การกำหนดนิยามของดาต้าเซ็นเตอร์ในยุค AI

AMD ขยายอีโคซิสเต็มด้าน Open AI

เพิ่มประสิทธิภาพการทำงานในระดับองค์กรด้วย AI PC

แบ่งปันข้อมูลให้เพื่อนผ่าน :