FLOPS – Wikipedia Tiếng Việt
Có thể bạn quan tâm
Nội dung
chuyển sang thanh bên ẩn- Đầu
- Bài viết
- Thảo luận
- Đọc
- Sửa đổi
- Sửa mã nguồn
- Xem lịch sử
- Đọc
- Sửa đổi
- Sửa mã nguồn
- Xem lịch sử
- Các liên kết đến đây
- Thay đổi liên quan
- Trang đặc biệt
- Liên kết thường trực
- Thông tin trang
- Trích dẫn trang này
- Lấy URL ngắn gọn
- Tải mã QR
- Tạo một quyển sách
- Tải dưới dạng PDF
- Bản để in ra
- Khoản mục Wikidata
Trong máy tính, FLOPS (FLoating-point Operations Per Second) là một thước đo hiệu suất máy tính, đặc biệt là trong lĩnh vực tính toán khoa học sử dụng nhiều các tính toán thập phân trong một giây.
1 tflops, hay 1 teraflops hay one trillion flops, là một nghìn tỷ con tính trong một giây, thường dùng để đo sức mạnh (performance) một hệ thống siêu máy tính song song. Đây là một khái niệm thường được sử dụng trong phép so sánh nhanh hay chậm giữa các phần cứng của máy tính trong quá trình huấn luyện của mạng neuron trong lĩnh vực trí tuệ nhân tạo.
FLOPs của một số bộ xử lý
[sửa | sửa mã nguồn]Vi kiến trúc | ISA | FP64 | FP32 | FP16 |
---|---|---|---|---|
Intel CPU | ||||
Intel 80486 | x87 (32-bit) | ? | 0.128[1] | ? |
Intel P5 PentiumIntel P6 Pentium Pro | x87 (32-bit) | ? | 0.5[1] | ? |
Intel P5 Pentium MMXIntel P6 Pentium II | MMX (64-bit) | ? | 1[2] | ? |
Intel P6 Pentium III | SSE (64-bit) | ? | 2[2] | ? |
Intel Netburst Pentium 4 (Willamette, Northwood) | SSE2 (64-bit) | 2 | 4 | ? |
Intel P6 Pentium M | SSE2 (64-bit) | 1 | 2 | ? |
Intel Netburst Pentium 4 (Prescott, Cedar Mill)Intel Netburst Pentium D (Smithfield, Presler)Intel P6 Core (Yonah) | SSE3 (64-bit) | 2 | 4 | ? |
Intel Core (Merom, Penryn)Intel Nehalem[3] (Nehalem, Westmere) | SSSE3 (128-bit)SSE4 (128-bit) | 4 | 8 | ? |
Intel Atom (Bonnell, Saltwell, Silvermont and Goldmont) | SSE3 (128-bit) | 2 | 4 | ? |
Intel Sandy Bridge (Sandy Bridge, Ivy Bridge) | AVX (256-bit) | 8 | 16 | 0 |
Intel Haswell[3] (Haswell, Devil's Canyon, Broadwell)Intel Skylake (Skylake, Kaby Lake, Coffee Lake, Comet Lake, Whiskey Lake, Amber Lake) | AVX2 & FMA (256-bit) | 16 | 32 | 0 |
Intel Xeon Phi (Knights Corner) | SSE & FMA (256-bit) | 16 | 32 | 0 |
Intel Skylake-X (Skylake-X, Cascade Lake)Intel Xeon Phi (Knights Landing, Knights Mill) Intel Ice Lake, Tiger Lake and Rocket Lake | AVX-512 & FMA (512-bit) | 32 | 64 | 0 |
AMD CPU | ||||
AMD Bobcat | AMD64 (64-bit) | 2 | 4 | 0 |
AMD JaguarAMD Puma | AVX (128-bit) | 4 | 8 | 0 |
AMD K10 | SSE4/4a (128-bit) | 4 | 8 | 0 |
AMD Bulldozer[3] (Piledriver, Steamroller, Excavator) | AVX (128-bit) Bulldozer-Steamroller AVX2 (128-bit) Excavator FMA3 (Bulldozer)[4] FMA3/4 (Piledriver-Excavator) | 4 | 8 | 0 |
AMD Zen (Ryzen 1000 series, Threadripper 1000 series, Epyc Naples)AMD Zen+[3][5][6][7] (Ryzen 2000 series, Threadripper 2000 series) | AVX2 & FMA (128-bit, 256-bit decoding)[8] | 8 | 16 | 0 |
AMD Zen 2[9] (Ryzen 3000 series, Threadripper 3000 series, Epyc Rome))AMD Zen 3 (Ryzen 5000 series) | AVX2 & FMA (256-bit) | 16 | 32 | 0 |
ARM CPU | ||||
ARM Cortex-A7, A9, A15 | ARMv7 | 1 | 8 | 0 |
ARM Cortex-A32, A35, A53, A55, A72, A73, A75 | ARMv8 | 2 | 8 | 0 |
ARM Cortex-A57[3] | ARMv8 | 4 | 8 | 0 |
ARM Cortex-A76, A77, A78 | ARMv8 | 8 | 16 | 0 |
ARM Cortex-X1 | ARMv8 | 16 | 32 | ? |
Qualcomm Krait | ARMv8 | 1 | 8 | 0 |
Qualcomm Kryo (1xx - 3xx) | ARMv8 | 2 | 8 | 0 |
Qualcomm Kryo (4xx - 5xx) | ARMv8 | 8 | 16 | 0 |
Samsung Exynos M1 and M2 | ARMv8 | 2 | 8 | 0 |
Samsung Exynos M3 and M4 | ARMv8 | 3 | 12 | 0 |
IBM PowerPC A2 (Blue Gene/Q) | ? | 8 | 8 (as FP64) | 0 |
Hitachi SH-4[10][11] | SH-4 | 1 | 7 | 0 |
Nvidia GPU | ||||
Nvidia Curie (GeForce 6 series and GeForce 7 series) | PTX | ? | 8 | ? |
Nvidia Tesla 2.0 (GeForce GTX 260-295) | PTX | ? | 2 | ? |
Nvidia Fermi (chỉ tính GeForce GTX 465–480, 560 Ti, 570-590) | PTX | 1/4 (locked by driver, 1 in hardware) | 2 | 0 |
Nvidia Fermi (chỉ tính Quadro 600-2000) | PTX | 1/8 | 2 | 0 |
Nvidia Fermi (chỉ tính Quadro 4000–7000, Tesla) | PTX | 1 | 2 | 0 |
Nvidia Kepler (GeForce (trừTitan and Titan Black), Quadro (except K6000), Tesla K10) | PTX | 1/12 (for GK110 | 2 | 0 |
Nvidia Kepler (GeForce GTX Titan and Titan Black, Quadro K6000, Tesla (trừ K10)) | PTX | 2/3 | 2 | 0 |
Nvidia MaxwellNvidia Pascal (không tính Quadro GP100 and Tesla P100) | PTX | 1/16 | 2 | 1/32 |
Nvidia Pascal (chỉ tính Quadro GP100 and Tesla P100) | PTX | 1 | 2 | 4 |
Nvidia Volta[12] | PTX | 1 | 2 (FP32) + 2 (INT32) | 16 |
Nvidia Turing (chỉ tính GeForce 16XX) | PTX | 1/16 | 2 (FP32) + 2 (INT32) | 4 |
Nvidia Turing (không tính GeForce 16XX) | PTX | 1/16 | 2 (FP32) + 2 (INT32) | 16 |
Nvidia Ampere[13][14] (chỉ tính Tesla A100/A30) | PTX | 2 | 2 (FP32) + 2 (INT32) | 32 |
Nvidia Ampere (gồm GeForce và Quadro, Tesla A40/A10) | PTX | 1/32 | 2 (FP32) + 0 (INT32) or 1 (FP32) + 1 (INT32) | 8 |
AMD GPU | ||||
AMD TeraScale 1 (Radeon HD 4000 series) | TeraScale 1 | 0.4 | 2 | ? |
AMD TeraScale 2 (Radeon HD 5000 series) | TeraScale 2 | 1 | 2 | ? |
AMD TeraScale 3 (Radeon HD 6000 series) | TeraScale 3 | 1 | 4 | ? |
AMD GCN (chỉ tính Radeon Pro W 8100-9100) | GCN | 1 | 2 | ? |
AMD GCN (không tính Radeon Pro W 8100-9100, Vega 10-20) | GCN | 1/8 | 2 | 4 |
AMD GCN Vega 10 | GCN | 1/8 | 2 | 4 |
AMD GCN Vega 20 (chỉ tính Radeon VII) | GCN | 2 | 4 | |
AMD GCN Vega 20 (chỉ tính Radeon Instinct MI50 / MI60 and Radeon Pro VII) | GCN | 1 | 2 | 4 |
AMD RDNA[15][16]AMD RDNA 2 | RDNA | 1/8 | 2 | 4 |
AMD CDNA | CDNA | 1 | 4 (Tenxơ)[17] | 16 |
AMD CDNA 2 | CDNA 2 | 4 (Tenxơ) | 4 (Tenxơ) | 16 |
Qualcomm GPU | ||||
Qualcomm Adreno 5x0 | Adreno 5xx | 1 | 2 | 4 |
Qualcomm Adreno 6x0 | Adreno 6xx | 1 | 2 | 4 |
Graphcore | ||||
Graphcore Colossus GC2[18][19][20] (values estimated) | ? | 0 | 18 | 72 |
Graphcore Colossus GC200 Mk2[21] (values estimated) | ? | 0 | 36 | 144 |
Supercomputer | ||||
ENIAC @ 100 Khz with 385 Flops[22] | ||||
48-bit processor @ 208 kHz in CDC 1604 in 1960 | ||||
60-bit processor @ 10 Mhz in CDC6600 in 1964 | 0.3 (FP60) | |||
60-bit processor @ 10 Mhz in CDC7600 in 1967 | 1.0 (FP60) [23] | |||
Cray-1 @ 80 Mhz in 1976 | 2 | |||
CDC Cyber 205 @ 50 Mhz in 1981 | FORTRAN compiler (ANSI 77 with vector extensions) | 8 | 16 | |
Vi kiến trúc | ISA | FP64 | FP32 | FP16 |
Source:[24]
Tham khảo
[sửa | sửa mã nguồn]- ^ a b “home.iae.nl”. Bản gốc lưu trữ ngày 19 tháng 10 năm 2021.
- ^ a b “Computing Power throughout History”. www.alternatewars.com. Bản gốc lưu trữ ngày 28 tháng 2 năm 2021. Truy cập ngày 13 tháng 2 năm 2021.
- ^ a b c d e Dolbeau, Romain (2017). “Theoretical Peak FLOPS per instruction set: a tutorial”. Journal of Supercomputing. 74 (3): 1341–1377. doi:10.1007/s11227-017-2177-5. S2CID 3540951.
- ^ “New instructions support for Bulldozer (FMA3) and Piledriver (FMA3+4 and CVT,BMI,TBM)” (PDF).
- ^ “Agner's CPU blog - Test results for AMD Ryzen”.
- ^ “AMD's moment of Zen: Finally, an architecture that can compete”. Ars Technica. Truy cập 5 tháng 9 năm 2023.
- ^ Mike Clark (23 tháng 8 năm 2016). A New x86 Core Architecture for the Next Generation of Computing (PDF). HotChips 28. AMD. Bản gốc (PDF) lưu trữ ngày 31 tháng 7 năm 2020. Truy cập ngày 9 tháng 11 năm 2021. page 7
- ^ “The microarchitecture of Intel and AMD CPUs” (PDF).
- ^ “AMD CEO Lisa Su's COMPUTEX 2019 Keynote”. www.youtube.com.
- ^ “Entertainment Systems and High-Performance Processor SH-4” (PDF). Hitachi Review. Hitachi. 48 (2): 58–63. 1999. Truy cập ngày 21 tháng 6 năm 2019.
- ^ “SH-4 Next-Generation DSP Architecture for VoIP” (PDF). Hitachi. 2000. Truy cập ngày 21 tháng 6 năm 2019.
- ^ “Inside Volta: The World's Most Advanced Data Center GPU”. 10 tháng 5 năm 2017.
- ^ “NVIDIA Ampere Architecture In-Depth”. 14 tháng 5 năm 2020.
- ^ “NVIDIA A100”.
- ^ “Alles zu Navi: Radeon RX 5700 XT ist RDNA mit GDDR6”.
- ^ “AMD Radeon RX 5700 XT”.
- ^ “AMD Instinct MI100 Accelerator”.
- ^ “6 threads per core imply that IPC is a multiple of 6, 1216 cores per chip”. www.youtube.com.
- ^ “250 TFLOPs/s for two chips with FP16 mixed precision”. www.youtube.com.
- ^ “Estimation via power consumption that FP32 is 1/4 of FP16 and that clock frequency is below 1.5GHz”. www.youtube.com.
- ^ “Introducing Graphcore's Mk2 IPU systems”. www.youtube.com.
- ^ “Computers of Yore”. www.clear.rice.edu. Truy cập ngày 26 tháng 2 năm 2021.
- ^ “CDC 7600”, Wikipedia (bằng tiếng Anh), 16 tháng 9 năm 2020, truy cập ngày 26 tháng 2 năm 2021
- ^ “Floating-Point Operations Per Second (FLOPS)”.
- Kiểm chuẩn máy tính
- Đơn vị đo tần suất
- Nguồn CS1 tiếng Anh (en)
Từ khóa » Flop Là Gì
-
Flop Là Gì? Ý Nghĩa Chuẩn Xác Của Flop Trên Tiktok, Facebook
-
Flop Là Gi? Flop Có Nghĩa Là Gì Trên Facebook
-
Flop Là Gi? Flop Có Nghĩa Là Gì Trên Facebook - THPT Sóc Trăng
-
Flop Là Gì ? Giải Nghĩa Về Flop Là Gì Trên Tiktok, Facebook - CoolMate
-
Flop Là Gì Trên Facebook, TikTok? Flop Nghĩa Là Gì Trong Kpop?
-
Flop Là Gì? Flop Là Gì Trên Facebook? Hiểu Như Thế Nào Cho đúng?
-
Flop Là Gì? Flop Có Nghĩa Là Gì Trên Facebook? - Activephanmem
-
Flop Là Gì Mà "sao" Nào Cũng Sợ? - Vietcetera
-
Flop Là Gì? Ý Nghĩa Của Flop Trên Facebook Và TikTok
-
Flop Là Gì? Ý Nghĩa Của Flop Trên Trên Facebook Và Kpop
-
Nhạc Flop, Phim Flop Mà Netizen Hay Nhắc Tới Nghĩa Là Gì? - VOH
-
Flop Là Gì, Dân Flop Là Gì Trên Facebook? |
-
Flop Là Gì? Flop Có Nghĩa Là Gì Trên Facebook? - Hỏi Gì 247
-
Flop Là Gì? Flop Nghĩa Là Gì Trên Facebook, TikTok Và Kpop?