Insight Daily

AMD เสนอความเป็นผู้นำด้านโซลูชั่น AI ณ งาน Advancing AI 2024

AMD (NASDAQ: AMD) ประกาศเปิดตัวโซลูชันการประมวลผลประสิทธิภาพสูงรุ่นล่าสุด เพื่อกำหนดนิยามของยุคแห่งการประมวลผลด้าน AI ประกอบด้วยโปรเซสเซอร์สำหรับเซิร์ฟเวอร์ 5th Gen AMD EPYC™, กราฟิกการ์ด AMD Instinct™ MI325X, ชิปหน่วยประมวลผลข้อมูล AMD Pensando™ Salina DPUs, AMD Pensando Pollara 400 NICs และโมบายโปรเซสเซอร์ AMD Ryzen™ AI PRO 300 series สำหรับโซลูชั่น AI ระดับองค์กร

AMD และพันธมิตร ยังได้นำเสนอการใช้งานโซลูชัน AI ของ AMD ในระดับองค์กร การเติบโตอย่างต่อเนื่องของระบบนิเวศซอฟต์แวร์ AI โอเพ่นซอร์สบน AMD ROCm™ และกลุ่มผลิตภัณฑ์ใหม่ที่หลากหลายบนพื้นฐานผลิตภัณฑ์กราฟิกการ์ด AMD Instinct, โปรเซสเซอร์ EPYC และโปรเซสเซอร์ Ryzen PRO

ดร.ลิซ่า ซู ประธานและซีอีโอ บริษัท AMD กล่าวว่า “ดาต้าเซ็นเตอร์และ AI เป็นโอกาสเติบโตที่สำคัญสำหรับ AMD และเรากำลังสร้างโมเมนตัมที่แข็งแกร่งสำหรับโปรเซสเซอร์ EPYC และกราฟิกการ์ด AMD Instinct ของเราในกลุ่มลูกค้าที่เพิ่มขึ้น ด้วยผลิตภัณฑ์ใหม่โปรเซสเซอร์ AMD EPYC กราฟิกการ์ด AMD Instinct และ Pensando DPUs เรากำลังส่งมอบเทคโนโลยีการประมวลผลระดับผู้นำเพื่อขับเคลื่อนเวิร์คโหลดงานที่สำคัญและมีความต้องการสูงที่สุดให้กับลูกค้าของเรา เมื่อมองไปในอนาคต เราเห็นว่าตลาดกราฟิกการ์ด AI สำหรับดาต้าเซ็นเตอร์จะเติบโตถึง 5 แสนล้านดอลลาร์ภายในปี 2028 เรามุ่งมั่นทุ่มเทเพื่อส่งมอบนวัตกรรมแบบเปิดผ่านโซลูชันระดับซิลิคอน ซอฟต์แวร์ เครือข่าย และคลัสเตอร์ของ AMD”

การกำหนดนิยามของดาต้าเซ็นเตอร์ในยุค AI

AMD ได้ประกาศเปิดตัวกลุ่มผลิตภัณฑ์ดาต้าเซ็นเตอร์สำหรับ AI ระดับองค์กร คลาวด์ และการผสานรวมงานที่หลากหลาย

พันธมิตรของ AMD ได้นำเสนอว่าพวกเขาใช้โซลูชันดาต้าเซ็นเตอร์ของ AMD ในการขับเคลื่อนความเป็นผู้นำด้าน generative AI มอบโครงสร้างพื้นฐานระบบคลาวด์ที่ใช้งานโดยผู้คนหลายล้านคนต่อวัน และขับเคลื่อนดาต้าเซ็นเตอร์แบบออน-เพรเมิส (on-prem) และแบบไฮบริดให้กับองค์กรชั้นนำต่าง ๆ


AMD ขยายอีโคซิสเต็มด้าน Open AI

AMD ยังคงลงทุนในอีโคซิสเต็มด้าน AI แบบเปิดและขยายซอฟต์แวร์โอเพ่นซอร์ส AMD ROCm ด้วยฟีเจอร์ เครื่องมือ การเพิ่มประสิทธิภาพ และการสนับสนุนใหม่ ๆ เพื่อช่วยให้ผู้พัฒนาสามารถดึงประสิทธิภาพได้สูงสุดจากกราฟิกการ์ด AMD Instinct และมอบการรองรับโมเดลด้าน AI ชั้นนำในปัจจุบัน โดยผู้นำธุรกิจด้าน AI อย่าง Essential AI, Fireworks AI, Luma AI และ Reka AI ได้หารือถึงวิธีการเพิ่มประสิทธิภาพบนโมเดลต่าง ๆ ทั้งบนฮาร์ดแวร์และซอฟต์แวร์ของ AMD

นอกจากนี้ AMD ยังได้จัดกิจกรรมสำหรับนักพัฒนา ซึ่งมีผู้นำด้านเทคนิคจากอีโคซิสเต็มนักพัฒนา AI เข้าร่วม เช่น Microsoft, OpenAI, Meta, Cohere, xAI และบริษัทชั้นนำอื่น ๆ มากมาย โดยมีผู้บรรยายชื่อดังซึ่งเป็นผู้ประดิษฐ์ภาษาการเขียนโปรแกรม โมเดล และเฟรมเวิร์ก AI ที่สำคัญต่อการปฎิรูปอุตสาหกรรม AI เช่น Triton, TensorFlow, vLLM และ Paged Attention, FastChat และอื่น ๆ อีกมากมาย ซึ่งได้มาแชร์วิธีที่นักพัฒนาปลดล็อกการเพิ่มประสิทธิภาพ AI ผ่านภาษาการเขียนโปรแกรมที่ไม่ขึ้นกับผู้ขายหรือผู้จัดจำหน่าย การเร่งความเร็วการประมวลผลโมเดลบนกราฟิกการ์ด AMD Instinct และการเน้นย้ำถึงความสะดวกในการพอร์ตไปยังซอฟต์แวร์ ROCm และวิธีที่อีโคซิสเต็มกำลังได้รับประโยชน์จากแนวทางโอเพ่นซอร์ส


เพิ่มประสิทธิภาพการทำงานในระดับองค์กรด้วย AI PC

AMD เปิดตัวโปรเซสเซอร์ AMD Ryzen AI PRO 300 Series ซึ่งเป็นโปรเซสเซอร์ที่ขับเคลื่อนขุมพลังการประมวลผลให้กับแล็ปท็อป Microsoft Copilot+ ตัวแรกที่เปิดใช้งานสำหรับองค์กร [3] กลุ่มผลิตภัณฑ์โปรเซสเซอร์ Ryzen AI PRO 300 Series ขยายความเป็นผู้นำของ AMD ด้านประสิทธิภาพการประมวลผลและอายุการใช้งานแบตเตอรี่ พร้อมด้วยฟีเจอร์ด้านความปลอดภัยและการจัดการระดับองค์กรสำหรับผู้ใช้งานทางธุรกิจ


[1] EPYC-022F: For a complete list of world records see: amd.com/worldrecords
[2] Testing conducted by internal AMD Performance Labs as of September 29, 2024 inference performance comparison between ROCm 6.2 software and ROCm 6.0 software on the systems with 8 AMD Instinct™ MI300X GPUs coupled with Llama 3.1-8B, Llama 3.1-70B, Mixtral-8x7B, Mixtral-8x22B, and Qwen 72B models.
ROCm 6.2 with vLLM 0.5.5 performance was measured against the performance with ROCm 6.0 with vLLM 0.3.3, and tests were performed across batch sizes of 1 to 256 and sequence lengths of 128 to 2048.
Configurations:
1P AMD EPYC™ 9534 CPU server with 8x AMD Instinct™ MI300X (192GB, 750W) GPUs, Supermicro AS-8125GS-TNMR2, NPS1 (1 NUMA per socket), 1.5 TiB (24 DIMMs, 4800 mts memory, 64 GiB/DIMM), 4x 3.49TB Micron 7450 storage, BIOS version: 1.8, , ROCm 6.2.0-00, vLLM 0.5.5, PyTorch 2.4.0, Ubuntu® 22.04 LTS with Linux kernel 5.15.0-119-generic.
vs.
1P AMD EPYC 9534 CPU server with 8x AMD Instinct™ MI300X (192GB, 750W) GPUs, Supermicro AS-8125GS-TNMR2, NPS1 (1 NUMA per socket), 1.5TiB 24 DIMMS, 4800 mts memory, 64 GiB/DIMM), 4x 3.49TB Micron 7450 storage, BIOS version: 1.8, ROCm 6.0.0-00, vLLM 0.3.3, PyTorch 2.1.1, Ubuntu 22.04 LTS with Linux kernel 5.15.0-119-generic. MI300-62
Server manufacturers may vary configurations, yielding different results. Performance may vary based on factors including but not limited to different versions of configurations, vLLM, and drivers.
[3] Based on Microsoft Copilot+ requirements of minimum 40 TOPS using AMD product specifications and competitive products announced as of Oct 2024. Microsoft requirements found here – https://support.microsoft.com/en-us/topic/copilot-pc-hardware-requirements-35782169-6eab-4d63-a5c5-c498c3037364. STXP-05.
[4] Based on a small node size for an x86 platform and cutting-edge, interconnected technologies, as of September 2024. GD-203b
[5] Testing as of Sept 2024 by AMD performance labs using the following systems: HP EliteBook X G1a with AMD Ryzen AI 9 HX PRO 375 processor @40W, Radeon™ 890M graphics, 32GB of RAM, 512GB SSD, VBS=ON, Windows 11 Pro; Lenovo ThinkPad T14s Gen 6 with AMD Ryzen™ AI 7 PRO 360 processor @22W, Radeon™ 880M graphics, 32GB RAM, 1TB SSD, VBS=ON, Windows 11 Pro; Dell Latitude 7450 with Intel Core Ultra 7 165U processor @15W (vPro enabled), Intel Iris Xe Graphics, VBS=ON, 32GB RAM, 512GB NVMe SSD, Microsoft Windows 11 Professional; Dell Latitude 7450 with Intel Core Ultra 7 165H processor @28W (vPro enabled), Intel Iris Xe Graphics, VBS=ON, 16GB RAM, 512GB NVMe SSD, Microsoft Windows 11 Pro.  The following applications were tested in Balanced Mode: Teams + Procyon Office Productivity, Teams + Procyon Office Productivity Excel, Teams + Procyon Office Productivity Outlook, Teams + Procyon Office Productivity Power Point, Teams + Procyon Office Productivity Word, Composite Geomean Score. Each Microsoft Teams call consists of 9 participants (3X3). Laptop manufactures may vary configurations yielding different results. STXP-10.
Testing as of Sept 2024 by AMD performance labs using the following systems: (1) Lenovo ThinkPad T14s Gen 6 with an AMD Ryzen™ AI 7 PRO 360 processor (@22W), Radeon™ 880M graphics, 32GB RAM, 1TB SSD, VBS=ON, Windows 11 Pro; (2) Dell Latitude 7450 with Intel Core Ultra 7 165U processor (@15W) (vPro enabled), Intel Iris Xe Graphics, VBS=ON, 32GB RAM, 512GB NVMe SSD, Microsoft Windows 11 Professional; and (3) Dell Latitude 7450 with Intel Core Ultra 7 165H processor (@28W) (vPro enabled), Intel Arc Graphics, VBS=ON, 16GB RAM, 512GB NVMe SSD, Microsoft Windows 11 Pro.  Tested applications (in Balanced Mode) include: Procyon Office Productivity, Procyon Office Productivity Excel, Procyon Office Productivity Outlook, Procyon Office Productivity Power Point, Procyon Office Productivity Word, Composite Geomean Score. Laptop manufactures may vary configurations yielding different results. STXP-11.
[6] Trillions of Operations per Second (TOPS) for an AMD Ryzen processor is the maximum number of operations per second that can be executed in an optimal scenario and may not be typical. TOPS may vary based on several factors, including the specific system configuration, AI model, and software version. GD-243.


▶︎ อัปเดตข่าวสาร และบทความต่างๆ
คลิกดูต่อที่ insight-daily.com ได้เลย!

 

Exit mobile version