NVIDIA CUDA ARCHITECTURE การ์ดแสดงผลของบริษัท Nvidia ได้มีเทคโนโลยีที่ใช้ในการประมวลผลที่เรียกว่า cuda ซึ่งเป็นเทคโนโลยีที่นำมาใช้เพื่อเพิ่มประสิทธิภาพการประมวลผลในชื่อว่า Fermi เป็น GPU ใหม่ที่สามารถประมวลผลในระดับ Giga thread จะประกอบไปด้วยเทคนิคและเทคโนโลยีด้านต่างๆดังนี้ - มี 512 cuda cores ที่ใช้ในการประมวลผลในแต่ละ Core จะมีโครงสร้างภายในดังภาพ ทำให้การประมวลผลมีความเร็วมากขึ้นถึง 8 เท่า มีค่า Double Precision Floating Point Capability = 256 FMA ops /clock และค่า Single Precision Floating Point Capability = 512 FMA ops /clock Nvidia Parallel DataCache การเรียกใช้ข้อมูลจากหน่วยความจำ Cache L1 และ L2 ในระดับ L1 จะถูกแชร์ให้สามารถใช้ร่วมกันได้ในแต่ละบล็อกของ Cores ในรูปแบบ one-chip แต่ในระดับ L2 นั้น จะถูกแชร์ให้กับทุก Cores สามารถ เรียกใช้ข้อมูลได้เลย - N vidia Giga Thread engine เพิ่มความสามารถในการรันคำสั่ง( execution ) มีระบบการทำงาน bi-directional data สามารถทำงานที่ต่างกันได้ในการประมวลผล Application เดียวกัน - รองรับ ECC(Error Correcting C...