**Thôi giờ phải nói về điểm "chính hiệu" của HD 7970 rồi: khả năng cày game! **
Ở phần trước, mình đã thấy HD 7970 với chip Tahiti, dùng kiến trúc GCN, có khả năng tính toán GPGPU cực xịn. Nhưng liệu mạnh GPGPU thì gaming có đỉnh không? Hay là vì để GPGPU xịn nên gaming lại... yếu xìu? Nếu bạn nghĩ đây là card của nhiều thứ "đầu tiên", thì không phải cái gì cũng ngon đâu nha...
Nhìn vào thông số cơ bản của HD 7970 và so với các anh em Radeon đời trước xem sao. Số lượng nhân xử lý (SP) trên HD 7970 thực ra không tăng nhiều so với HD 6970 hay HD 5870 đâu (chỉ nhiều hơn 33% thôi). Số TMU (texture mapping unit) thì đi kèm theo kiến trúc: 16 SP đi với 1 TMU (GCN và VLIW4) hoặc 20 SP với 1 TMU (VLIW5), nên về cơ bản hiệu năng xử lý texture tỷ lệ thuận với số SP. Chỉ có số ROP (render output unit) là không đổi từ lâu rồi. Điều này cho thấy AMD tự tin lắm với khả năng render hiện tại (họ chỉ tăng ROP lên 32 đơn vị từ HD 5870, còn HD 4870 chỉ có 16 ROP đi với 800 SP).
Vậy có thể nói HD 7970 về cơ bản khá giống HD 6970 khi nhìn từ góc độ game. Khác biệt chính nằm ở số SP, xung của từng SP và băng thông nhớ. Nhưng băng thông nhớ chỉ ảnh hưởng khi bạn chơi game ở độ phân giải khủng (1920 x 1200 trở lên hoặc nhiều màn hình). Từ HD 5000, AMD giới thiệu công nghệ Eyefinity cho phép một GPU xuất tín hiệu ra nhiều màn hình cùng lúc, và điều này cần bộ nhớ "trâu" hơn để đáp ứng. Đây là lý do AMD "hào phóng" gắn tận 3GB GDDR5 lên HD 7970.
Kết hợp với chênh lệch xung nhân khoảng 5%, có thể nói "về lý thuyết": HD 7970 mạnh hơn HD 6970 khoảng 40%. "Trong thực tế", con số này sẽ thấp hơn đó.
**Hiểu thêm về GCN nè **
Nếu theo dõi phần trên, có thể vài bạn sẽ nghĩ GCN cơ bản giống VLIW4: các nhóm 16 SP hợp lại thành bộ tứ, rồi từng bộ tứ này chia sẻ bộ đệm L1 Cache để tạo thành CU, khá giống SIMD VLIW4 có 16 SP nhưng mỗi SP là bộ tứ các ALU. Tóm lại thì CU hay SIMD đều chỉ có 64 ALU (16 x 4). Vậy có gì mới?
Cái mới không nằm ở cấu tạo từng SIMD hay CU, mà ở **cách hoạt động** của chúng.
Bên phải là SIMD VLIW4 có 16 SP, mỗi SP có 4 ALU. Bên trái là CU có 4 SIMD GCN, mỗi SIMD có 16 ALU. Các đơn vị này sẽ xử lý các làn sóng lệnh (wavefront) mà scheduler hoặc compiler gửi đến. Điểm thú vị nè: các CU xử lý lần lượt theo tập lệnh (instruction) - từ trên xuống - còn SIMD VLIW4 xử lý theo wavefront - từ trái qua phải.
Và đây là vấn đề: thực tế các CU hoặc SIMD sẽ nhận wavefront, rồi mỗi wavefront lại ngắt ra nhiều tập lệnh khác nhau. Nói cách khác nếu tập lệnh trong wavefront B cần kết quả từ wavefront A thì quá trình xử lý wavefront B phải "chờ" wavefront A xong mới tiếp tục. Xem ví dụ này:
- Có 15 wavefront cần xử lý. Nếu mọi thứ "hoàn hảo" thì chỉ cần 15/4 ~ 4 chu kỳ nạp lệnh để CU hoặc SIMD VLIW4 hoàn tất
- Nhưng "đời không như mơ", có 5 wavefront lệ thuộc vào kết quả của wavefront trước, nên SIMD VLIW4 không xử lý xong trong 4 chu kỳ mà thực tế là **6 chu kỳ**
- Còn CU thì sao? Vì CU xử lý theo tập lệnh, không theo wavefront. Nên gặp wavefront nào "đang chờ", CU sẽ bỏ qua để nhận lệnh khác xử lý tiếp. Vì thế cơ bản CU xử lý nhanh hơn SIMD VLIW4. Như ở đây là **4 chu kỳ**, tức nhanh hơn 30% so với VLIW4, trong khi số ALU bằng nhau
Dĩ nhiên vẫn có tình huống "đau khổ" khi 15 wavefront đều lệ thuộc lẫn nhau. Khi đó hiệu năng 2 kiến trúc như nhau, nhưng nhìn chung GCN hiệu quả hơn khi tận dụng thời gian của từng ALU tốt hơn.
**Không chỉ là hiệu năng đâu nha **
Như đã nói, HD 7970 là card khá quan trọng với AMD. Nó có nhiều thứ "đầu tiên" lắm. Mặc dù nhiều tính năng thế, nhưng điều đáng tiếc là nhiều bạn không có điều kiện tận dụng hết khả năng của nó. Vì thế ở đây mình chỉ liệt kê sơ bộ vài tính năng "xịn" nhưng có dùng được không thì... tùy bạn!
**- DX 11.1**
Tahiti là GPU đầu tiên hỗ trợ DX 11.1. Bộ DX này sẽ xuất hiện cùng Windows 8 mà Microsoft chuẩn bị ra mắt. Các tính năng mới trên DX 11.1 vẫn chưa rõ, nhưng "nghe nói" Windows 8 sẽ hỗ trợ công nghệ Stereo 3D (S3D), muốn dùng thì phải có màn hình/kính 3D mới trải nghiệm được.
**- Partially Resident Textures (PRT)**
Khi độ phân giải game ngày càng lớn (qua AMD Eyefinity hay NVIDIA Surround), kích thước texture cũng tăng theo. Kích thước càng lớn sẽ làm nặng băng thông nhớ và tăng độ trễ khi copy dữ liệu. Ý tưởng giải quyết là dùng texture mới - PRT (nguyên gốc là Megatexture) có thể chia ra nhiều khối texture nhỏ để copy "dần dần", giảm tải cho bộ nhớ.
**- Eyefinity Technology 2.0**
Nếu bạn "có điều kiện" trang bị 3 màn hình để trải nghiệm Eyefinity, HD 7970 sẽ khắc phục vài nhược điểm của công nghệ cũ. Bạn có thể "định vị" lại giao diện desktop cho vừa mắt, nghe âm thanh "vòm" từ cả 3 phía màn hình chứ không chỉ từ một chiếc như trước. Nhưng mình không nghĩ nhiều bạn đọc có thể trải nghiệm được (lý do thì... bạn biết đấy ).
**- Fast HDMI**
Đây có thể coi là tính năng "đi tắt đón đầu" của AMD: hỗ trợ màn hình HDMI có độ phân giải 4K x 2K. Để đáp ứng điều này thì băng thông trên cable HDMI phải tăng lên. AMD thực hiện bằng cách đẩy xung tín hiệu HDMI lên 340 MHz. Nhưng không hiểu sao họ lại marketing thành 3 GHz HDMI!?
**- Video Codec Engine (VCE)**
Nếu Intel có Quick Sync hay ho trên chip Sandy Bridge (SnB), giúp giảm thời gian convert phim thì AMD cũng không chịu thua. Thậm chí, AMD còn đi xa hơn bằng cách khai thác các SP trên Tahiti để tăng tốc ở chế độ Hybrid. Đây là tính năng VCE, phiên bản cạnh tranh với Quick Sync từ AMD. Khác biệt là VCE chạy trên GPU, còn Quick Sync chạy trên CPU SnB socket LGA 1155.
**- PCI Express (PCIe) 3.0**
Khi ra mắt HD 7970, AMD đồng thời chiếm vị trí hãng đầu tiên có GPU hỗ trợ PCIe 3.0. Nhiều người nghĩ NVIDIA sẽ làm điều này trước với chip Kepler, nhưng AMD mới là người thắng. PCIe 3.0 cung cấp băng thông gấp đôi PCIe 2.0: 16 vs. 8 GB/s khi chạy ở 16x. Tuy nhiên hiệu quả thực tế chưa thấy rõ với các card hiện nay. Sẽ cần vài thế hệ card nữa mới khai thác được chuẩn mới này.
**- ZeroCore**
HD 7970 không chỉ mạnh mẽ, mà còn tiết kiệm điện khủng khiếp khi ở chế độ nghỉ (idle). Điều này một phần nhờ công nghệ 28nm, một phần từ ý tưởng: không xuất tín hiệu màn hình thì không cần hoạt động. Vì card chỉ xuất tín hiệu khi có gắn màn hình. Nên khi ở chế độ 2D (ngoài desktop) mà bạn chạy nhiều card (CrossFire), những card không nối màn hình sẽ gần như tắt hẳn. Ngoài ra khi không có thay đổi tín hiệu màn hình (chờ quá lâu), bản thân card chính cũng giảm hoạt động tối đa. Tất cả nhằm mục tiêu: tiết kiệm điện càng nhiều càng tốt. AMD nói: ở mức thấp nhất, HD 7970 chỉ tốn 3W!
**Thực tế hiệu năng thế nào? **
Lý thuyết nhiều rồi, thực tế thì sao? Ở đây, mình chọn kết quả benchmark mới nhất từ AnandTech, bao gồm cả model riêng của XFX, HD 7970 Black Edition Double Dissipation, với tản nhiệt riêng và xung card được OC sẵn lên 1 GHz (nhân) / 5,7 GHz (nhớ).
Vì HD 7970 (bản thường) có giá tại Mỹ 550 USD nên khi về Việt Nam và các nước khác, chắc chắn giá không rẻ tí nào. Card này hướng đến người dùng cao cấp, nên thực tế chúng ta chỉ cần quan tâm hiệu năng ở độ phân giải 1920 x 1200 trở lên (ai lại mua card này để chơi game màn hình nhỏ chứ ).
Nhớ rằng về lý thuyết, HD 7970 mạnh hơn HD 6970 khoảng 40%. Xem thực tế nào!
Rất rõ ràng, HD 7970 mạnh hơn hẳn đàn anh HD 6970 và cả đối thủ chính là GTX 580 ở sau một khoảng khá an toàn. Đây là lý do AMD đặt giá HD 7970 cao: vì nó mạnh hơn GTX 580!
**Nhiệt độ, điện năng, lời kết
Nhờ tiến trình 28nm, Tahiti trở thành một trong các GPU cao cấp có mức tiêu thụ điện ở idle gần như thấp nhất, mặc dù nó mang trên mình tới... 4,3 tỷ transistor (!) nhiều hơn bất kỳ GPU nào. Nhưng ở chế độ tải cao, đây vẫn là card Radeon đơn chip ngốn điện nhất. Tuy nhiên nó vẫn thấp hơn đối thủ chính NVIDIA là GTX 580, một ưu thế hợp lý để chọn card này thay cho đại diện đơn chip cao cấp nhất nhà GeForce.
Về nhiệt độ & độ ồn, HD 7970 nằm ở vị trí rất "thoải mái" so với các đại diện khác. Hệ thống tản nhiệt vapor chamber giữ cho nó luôn ở ngưỡng nóng "vừa đủ" và đảm bảo độ ổn định lâu dài (không bàn model của XFX ở đây nhé).
**Tổng kết lại**, card tập hợp nhiều cái "đầu tiên" từ AMD đã cho thấy hiệu năng ấn tượng, không chỉ gaming mà GPGPU lại càng khiến giới công nghệ ngạc nhiên (đặc biệt ai muốn dùng cho nghiên cứu khoa học, tính toán thiên văn, dự báo thời tiết...). Ngoại trừ giá còn "chát" (vì phải cao hơn GTX 580), gần như không còn gì để chê HD 7970.
Nguồn: gamek.vn