[問題] sycl avx比較
開發平台(Platform): (Ex: Win10, Linux, ...)
在 AMD / intel消費級筆電處理器 比較銷率
編譯器(Ex: GCC, clang, VC++...)+目標環境(跟開發平台不同的話需列出)
sycl vs gcc -mavx2
額外使用到的函數庫(Library Used): (Ex: OpenGL, ...)
問題(Question):
有矩陣向量的程式碼已經用avx2 intrinsic實作
在intel/AMD這類消費級處理器可以加速跑了
有看到sycl cpp範例 在intel one-api看到例子說可以做異質計算
想問這類sycl搭載intel 13代或下一代消費處理器+內顯級別的 計算時陣向量時間
跟它純用cpu 的 multi-thread + avx2去跑 還會更快嗎?
或者有無類似的比較
感謝
餵入的資料(Input):
預期的正確結果(Expected Output):
錯誤結果(Wrong Output):
程式碼(Code):(請善用置底文網頁, 記得排版,禁止使用圖檔)
補充說明(Supplement):
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 27.247.229.228 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/C_and_CPP/M.1717594201.A.CB9.html