c++ 性能优化资源

 
链接 类别 推荐理由 业务可用性
https://www.brendangregg.com/perf.html 性能分析工具 linux perf大佬brendangregg官方网站 ⭐️⭐️⭐️⭐️⭐️ 强烈推荐
https://perfetto.dev/ 性能分析工具 Android和Chrome内置性能分析平台 ⭐️⭐️⭐️⭐️⭐️ 强烈推荐
https://github.com/google/benchmark Benchmark Google benchmark框架 ⭐️⭐️⭐️⭐️⭐️ 强烈推荐
https://quick-bench.com/q/G7B2w0xPUWgOVvuzI7unES6cU4w 性能分析工具 一个针对C++ benchmark的在线工具 ⭐️⭐️⭐️⭐️⭐️ 强烈推荐
https://github.com/facontidavide/CPP_Optimizations_Diary 性能优化案例 高性能C++编程的一些例子 ⭐️⭐️⭐️⭐️⭐️ 强烈推荐
https://godbolt.org/ 性能分析工具 著名的在线编译器行为分析网站 ⭐️⭐️⭐️⭐️⭐️ 强烈推荐
https://github.com/brendangregg/FlameGraph 性能分析工具 火焰图, 无需过多介绍 ⭐️⭐️⭐️⭐️⭐️ 强烈推荐
https://github.com/Netflix/flamescope 性能分析工具 火焰图的scope版本 ⭐️⭐️⭐️⭐️⭐️ 强烈推荐
https://github.com/brendangregg/perf-tools 性能分析工具 Gregg性能分析工具合集 ⭐️⭐️⭐️⭐️⭐️ 强烈推荐
https://github.com/mtrebi/memory-allocators 基础库 内存分配器合集 ⭐️⭐️⭐️⭐️⭐️ 强烈推荐
https://github.com/taskflow/taskflow 基础库 著名的C++ DAG异步调度与并行计算库 ⭐️⭐️⭐️⭐️⭐️ 强烈推荐
https://github.com/gperftools/gperftools 性能分析工具 Google gperftools ⭐️⭐️⭐️⭐️⭐️ 强烈推荐
https://github.com/namhyung/uftrace 性能分析工具 User Space Ftrace, 可基于function instrumentatin或者plt hook动态获取函数执行行为 ⭐️⭐️⭐️⭐️⭐️ 强烈推荐
https://github.com/google/tcmalloc 基础库 Google Tcmalloc开源版本 ⭐️⭐️⭐️⭐️⭐️ 强烈推荐
https://github.com/thenifty/neon-guide 性能优化案例 非常干货的NEON优化示例 ⭐️⭐️⭐️⭐️⭐️ 强烈推荐
https://github.com/andikleen/pmu-tools 性能分析工具 Andi Kleen的Top-Down分析工具 ⭐️⭐️⭐️⭐️⭐️ 强烈推荐
https://github.com/jlfwong/speedscope 性能分析工具 火焰图的web可视化界面, 类似systrace/perfetto ⭐️⭐️⭐️⭐️⭐️ 强烈推荐
https://champyen.blogspot.com/ 技术博客/综合资料/专业网站 一位台湾大哥的blog, 擅长面向底层的性能优化技巧 ⭐️⭐️⭐️⭐️⭐️ 强烈推荐
https://easyperf.net/notes/ 技术博客/综合资料/专业网站 PATMC作者个人blog ⭐️⭐️⭐️⭐️⭐️ 强烈推荐
https://gitlab.arm.com/telemetry-solution/telemetry-solution/-/tree/main/tools/topdown_tool 性能分析工具 ARM官方top-down分析工具, 目前只支持Neoverse, 但A55也可以用. 需要板端支持python ⭐️⭐️⭐️⭐️⭐️ 强烈推荐
       
https://github.com/MegEngine/MegPeak Benchmark 旷视开源的CPU指令 latency/throughput测试程序 ⭐️⭐️⭐️⭐️⭐️ 强烈推荐
https://dokumen.tips/documents/simd-assembly-tutorial-arm-neon-xiphorg.html?page=1 性能优化案例 Mozilla的一份ARM Neon教程, 比较老但是干货很多 ⭐️⭐️⭐️⭐️⭐️ 强烈推荐
https://users.ece.cmu.edu/~franzf/papers/gttse07.pdf 性能分析资料/书籍/论文 详细讲解如何优化数值计算程序的一篇综述 ⭐️⭐️⭐️⭐️⭐️ 强烈推荐
https://github.com/intel/ARM_NEON_2_x86_SSE 基础库 ARM NEON和X86 SSE转换库 ⭐️⭐️⭐️⭐️ 值得一试
https://github.com/JonathanSalwan/PinTools 性能分析工具 Intel Binary Instrumentation Tools ⭐️⭐️⭐️⭐️ 值得一试
https://github.com/pigirons/cpufp 性能优化案例 CPU浮点算力峰值测速程序, 作者是商汤HPC负责人高叔叔 ⭐️⭐️⭐️⭐️ 值得一试
https://github.com/apache/tvm 性能优化工具 目前非常主流的自动编译与优化框架 ⭐️⭐️⭐️⭐️ 值得一试
https://github.com/koute/bytehound 性能分析工具 一个非常强大的内存泄露分析与统计工具, 支持内嵌DSL ⭐️⭐️⭐️⭐️ 值得一试
https://github.com/ARM-software/HWCPipe 性能分析工具 ARM官方的PMU API封装 ⭐️⭐️⭐️⭐️ 值得一试
https://github.com/0xddaa/pin 性能分析工具 基于intel pintools的一些应用案例 ⭐️⭐️⭐️⭐️ 值得一试
https://github.com/andikleen/simple-pt 性能分析工具 Intel Processor Trace工具 ⭐️⭐️⭐️⭐️ 值得一试
https://github.com/bluealert/MetaNN-book 性能优化资料/书籍/论文 深入介绍表达式模板技术的一本书 ⭐️⭐️⭐️⭐️ 值得一试
https://lemire.me/blog/2017/07/10/pruning-spaces-faster-on-arm-processors-with-vector-table-lookups/ 性能优化案例 ARM Neon的一个优化例子 ⭐️⭐️⭐️⭐️ 值得一试
https://github.com/bytedance/btrace 性能分析工具 字节开源的trace工具 ⭐️⭐️⭐️⭐️ 值得一试
https://github.com/travisdowns/uarch-bench Benchmark 一个CPU微架构benchmark工具集 ⭐️⭐️⭐️⭐️ 值得一试
https://llvm.org/doxygen/classllvm_1_1SmallVector.html 基础库 LLVM内置的small vector实现 ⭐️⭐️⭐️⭐️ 值得一试
https://flatbuffers.dev/flatbuffers_benchmarks.html Benchmark flatbuffers benchmark数据 ⭐️⭐️⭐️⭐️ 值得一试
https://github.com/RRZE-HPC/ibench Benchmark 一个测试X86/ARM CPU latency/throughput的程序, 纯汇编实现 ⭐️⭐️⭐️⭐️ 值得一试
https://github.com/powturbo/Turbo-Run-Length-Encoding 基础库 一个非常快速的rle实现 ⭐️⭐️⭐️⭐️ 值得一试
https://github.com/Maratyszcza/FP16/tree/master 基础库 一个完整的fp16数据格式转换库, 支持arm和x86 ⭐️⭐️⭐️⭐️ 值得一试
https://people.eecs.berkeley.edu/~kubitron/cs252/handouts/papers/RooflineVyNoYellow.pdf 性能分析理论 Roofline Model的原始论文 ⭐️⭐️⭐️ 建议精读
https://www.nersc.gov/assets/Uploads/Tutorial-ISC2019-Intro-v2.pdf 性能分析理论 关于Roofline Model的一个talk ⭐️⭐️⭐️ 建议精读
https://dando18.github.io/posts/2020/04/02/roofline-model 性能分析理论 关于Roofline Model的一个博客 ⭐️⭐️⭐️ 建议精读
https://crd.lbl.gov/assets/pubs_presos/parlab08-roofline-talk.pdf 性能分析理论 关于Roofline Model的一个talk ⭐️⭐️⭐️ 建议精读
https://www.spiral.net/software/roofline.html 性能分析理论 基于测试数据生成Roofline Model的一个尝试 ⭐️⭐️⭐️ 建议精读
https://spiral.ece.cmu.edu/pub-spiral/pubfile/paper_181.pdf 性能分析理论 基于Roofline Model, 在微架构层面进行性能瓶颈分析的一篇论文 ⭐️⭐️⭐️ 建议精读
https://research.google/pubs/pub44271/ 性能分析理论 Google的一篇论文, 分析了20000台服务器在3年内的负载情况, 在性能分析方面有非常高的视野(和钞能力…) ⭐️⭐️⭐️ 建议精读
https://mirrors.edge.kernel.org/pub/linux/kernel/people/paulmck/perfbook/perfbook.html 性能分析理论 并行编程著名读物,perf-book, 全称是 Is Parallel Programming Hard, And, If So, What Can You Do About It? ⭐️⭐️⭐️ 建议精读
https://github.com/rsy56640/triviality/tree/master/content/perf-book 技术博客/综合资料/专业网站 perf-book读后感 ⭐️⭐️⭐️ 建议精读
https://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.112.6406&rep=rep1&type=pdf 性能优化案例 Hazard Pointer的一个应用例子 ⭐️⭐️⭐️ 建议精读
https://queue.acm.org/detail.cfm?id=2413037 技术博客/综合资料/专业网站 Greeg的一篇文章, 综述性能分析的方法论 ⭐️⭐️⭐️ 建议精读
https://github.com/downdemo/Cpp-Concurrency-in-Action-2ed 性能分析理论 CPP并发编程 ⭐️⭐️⭐️ 建议精读
https://github.com/tpoisonooo/how-to-optimize-gemm 性能优化案例 GEMM优化的一个案例, 循序渐进版本 ⭐️⭐️⭐️ 建议精读
http://halobates.de/blog/ 技术博客/综合资料/专业网站 Andi Kleen个人blog ⭐️⭐️⭐️ 建议精读
https://www.lei.chat/ 技术博客/综合资料/专业网站 一位在google负责IREE相关工作的个人blog ⭐️⭐️⭐️ 建议精读
https://zhenhuaw.me/blog/2019/gemm-optimization.html 性能优化案例 一个GEMM优化案例 ⭐️⭐️⭐️ 建议精读
https://easyperf.net/blog/2019/10/05/Performance-Analysis-Of-MT-apps 性能分析资料/书籍/论文 多线程程序分析案例 ⭐️⭐️⭐️ 建议精读
https://resources.linaro.org/zh/resource/Vi6mFmZgTfjKH6C6HhsmBa 性能分析工具 ARM SPE介绍, J6会搭载 ⭐️⭐️⭐️ 建议精读
https://resources.linaro.org/zh/resource/uy5kkd5W1NJ1UhxsevgBNN 性能优化案例 ARM平台Numpy优化的一个例子 ⭐️⭐️⭐️ 建议精读
https://hal.science/hal-01915529/document 性能优化案例 Data Layout与SIMD优化的综述 ⭐️⭐️⭐️ 建议精读
https://github.com/charguer/aosoa-demo 性能优化案例 展示SOA/AOS对性能优化的影响 ⭐️⭐️⭐️ 建议精读
https://www.androidperformance.com/ 技术博客/综合资料/专业网站 Android性能优化网站 ⭐️⭐️⭐️ 建议精读
https://www.brendangregg.com/blog/2020-07-15/systems-performance-2nd-edition.html 技术博客/综合资料/专业网站 Gregg大佬的系统性能分析书籍 ⭐️⭐️⭐️ 建议精读
https://github.com/PacktPublishing/Cpp-High-Performance 技术博客/综合资料/专业网站 C++ high performance书籍配套代码 ⭐️⭐️⭐️ 建议精读
https://www.packtpub.com/product/c-high-performance-second-edition/9781839216541 技术博客/综合资料/专业网站 C++ high performance Programming ⭐️⭐️⭐️ 建议精读
https://www.aristeia.com/TalkNotes/codedive-CPUCachesHandouts.pdf 技术博客/综合资料/专业网站 介绍CPU Cache的经典资料 ⭐️⭐️⭐️ 建议精读
https://developer.arm.com/documentation/EPM128372/0300/?lang=en 技术博客/综合资料/专业网站 ARM A55软件优化指南 ⭐️⭐️⭐️ 建议精读
https://developer.arm.com/documentation/100442/latest/ 技术博客/综合资料/专业网站 ARM A55 Technical Reference Manual ⭐️⭐️⭐️ 建议精读
https://faculty.cc.gatech.edu/~hyesoon/lee_taco12.pdf 技术博客/综合资料/专业网站 专门讲解prefetch机制的一篇论文 ⭐️⭐️⭐️ 建议精读
https://www.researchgate.net/publication/269302126_A_Top-Down_method_for_performance_analysis_and_counters_architecture 性能分析理论 Ashin的top-down分析理论原始论文 ⭐️⭐️⭐️ 建议精读
https://scholar.google.com/citations?view_op=view_citation&hl=en&user=yeiYmAUAAAAJ&citation_for_view=yeiYmAUAAAAJ:qjMakFHDy7sC 性能分析资料/书籍/论文 对Google数万台服务器的frontend stall分析论文 ⭐️⭐️⭐️ 建议精读
https://www.agner.org/optimize/optimizing_cpp.pdf 性能优化案例 Agner Fog关于高性能C++编程的一本书 ⭐️⭐️⭐️ 建议精读
https://www.intel.com/content/dam/develop/external/us/en/documents/performance-analysis-guide-181827.pdf 性能分析资料/书籍/论文 Intel i7 CPU性能分析指南 ⭐️⭐️⭐️ 建议精读
https://sites.google.com/lbl.gov/cs267-spr2018/ 技术博客/综合资料/专业网站 UC Berkeley 2018 并行计算课程, cs267 ⭐️⭐️⭐️ 建议精读
https://pdfcoffee.com/embedded-systems-arm-programming-and-optimization-pdf-free.html 技术博客/综合资料/专业网站 一本面向ARM平台的性能分析的书 ⭐️⭐️⭐️ 建议精读
https://www.gooneyryan.com/download/boost%E7%A8%8B%E5%BA%8F%E5%BA%93%E5%AE%8C%E5%85%A8%E5%BC%80%E5%8F%91%E6%8C%87%E5%8D%97%EF%BC%9A%E6%B7%B1%E5%85%A5c%E5%87%86%E6%A0%87%E5%87%86%E5%BA%93 技术博客/综合资料/专业网站 Boost标准库深入开发指南, 第三版, 主要是C++11和14, 与我们业务比较贴近. 值得学一学如何封装高性能C++类 ⭐️⭐️⭐️ 建议精读
https://www.cs.cmu.edu/afs/cs/academic/class/15210-f15/www/tapp.html 性能优化案例 CMU并行编程课程15210 ⭐️⭐️⭐️ 建议精读
Structured Parallel Programming - Patterns for Effieicnt Computation 性能优化资料/书籍/论文 ⭐️⭐️⭐️ 建议精读
https://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.395.378&rep=rep1&type=pdf 性能优化资料/书籍/论文 Hazard Pointer, 无锁编程的一种重要组件 ⭐️⭐️ 可以参考
https://github.com/facebook/folly 基础库 Meta开源的C++基础库, 有很多并行编程相关的高性能实现 ⭐️⭐️ 可以参考
https://github.com/CodingHanYa/workspace 基础库 一个C++实现的异步编程框架 ⭐️⭐️ 可以参考
https://github.com/google/pprof 性能分析工具 Google的profiling数据中间协议 ⭐️⭐️ 可以参考
https://github.com/MegEngine/mperf 性能分析工具 旷视开源的一套ARM平台roofline/top-down分析工具 ⭐️⭐️ 可以参考
https://github.com/Juude/awesome-android-performance 性能分析资料/书籍/论文 Android Performance相关的资料汇总 ⭐️⭐️ 可以参考
https://github.com/ARM-software/workload-automation 性能分析工具 ARM针对Android提供的一些workload ⭐️⭐️ 可以参考
https://github.com/kfrlib/kfr 基础库 一个C++ DSP计算框架 ⭐️⭐️ 可以参考
https://github.com/google/gemmlowp 基础库 Google的低精度量化Gemm计算库 ⭐️⭐️ 可以参考
https://www.intel.com/content/www/us/en/docs/vtune-profiler/cookbook/2023-0/top-down-microarchitecture-analysis-method.html#top-down-microarchitecture-analysis-method_GUID-FA8F07A1-3590-4A91-864D-CE96456F84D7 性能分析工具 Intel官方的vtune工具 ⭐️⭐️ 可以参考
https://github.com/jmpews/Dobby 性能分析工具 一个跨平台hook框架 ⭐️⭐️ 可以参考
https://github.com/DynamoRIO/dynamorio 性能分析工具 ARM平台著名的binary instrumentation工具 ⭐️⭐️ 可以参考
https://github.com/p12tic/libsimdpp 基础库 C++ SIMD封装 ⭐️⭐️ 可以参考
https://github.com/VcDevel/Vc 基础库 另一个C++ SIMD/并行计算封装 ⭐️⭐️ 可以参考
https://github.com/VcDevel/std-simd 基础库 另一个C++ SIMD/并行计算封装 ⭐️⭐️ 可以参考
https://github.com/xtensor-stack/xsimd 基础库 另一个C++ SIMD/并行计算封装 ⭐️⭐️ 可以参考
https://github.com/shibatch/sleef 基础库 C标准数学库的并行实现版本 ⭐️⭐️ 可以参考
https://github.com/sharkdp/hyperfine Benchmark 一个命令行benchmark程序 ⭐️⭐️ 可以参考
https://github.com/openmlsys/openmlsys-zh 技术博客/综合资料/专业网站 开源深度学习系统平台教程 ⭐️⭐️ 可以参考
https://github.com/google/bloaty 性能分析工具 二进制size profiling tool ⭐️⭐️ 可以参考
https://github.com/tpn/pdfs 性能分析理论 CS相关pdf大合集 ⭐️⭐️ 可以参考
https://github.com/MegEngine/MegCC 基础库 旷视开源的NN推理框架, 用代码生成的方式, 做到了极小的binary size和不错的性能 ⭐️⭐️ 可以参考
https://github.com/flame/blislab 性能优化案例 GEMM优化沙箱 ⭐️⭐️ 可以参考
https://github.com/janestreet/magic-trace 性能分析工具 一个魔改版本的systrace ⭐️⭐️ 可以参考
https://github.com/tpoisonooo/chgemm 性能优化案例 魔改版本的int8 gemm实现 ⭐️⭐️ 可以参考
https://github.com/zchrissirhcz/smallcv 基础库 一个非常精简的cv库, 兼容opencv ⭐️⭐️ 可以参考
https://github.com/microsoft/perfview 性能分析工具 微软的一套性能分析套件 ⭐️⭐️ 可以参考
https://github.com/Dr-Noob/cpufetch 性能分析工具 获取CPU微架构参数的小程序 ⭐️⭐️ 可以参考
https://github.com/simdjson/simdjson 性能优化案例 SIMD版本的json parser库, 但据说跨平台一致性不好 ⭐️⭐️ 可以参考
https://github.com/lemire/simple_fastfloat_benchmark Benchmark fastfloat benchmark ⭐️⭐️ 可以参考
https://github.com/fastfloat/fast_float 性能优化案例 float字符串解析的快速实现 ⭐️⭐️ 可以参考
https://github.com/ARM-software/gator 性能分析工具 ARM Mobile Studio在板端的wrapper程序 ⭐️⭐️ 可以参考
https://github.com/ARM-software/synchronization-benchmarks Benchmark ARM官方的同步相关用例benchmark ⭐️⭐️ 可以参考
https://github.com/ARM-software/HPCG_for_Arm Benchmark ARM官方的HPC负载测试程序 ⭐️⭐️ 可以参考
https://github.com/bytedance/bhook 性能分析工具 字节开源的hook框架 ⭐️⭐️ 可以参考
https://github.com/wolfpld/tracy 性能分析工具 一个面向游戏的性能分析框架 ⭐️⭐️ 可以参考
https://bitbucket.org/oebeling/tracectory/wiki/Home 性能分析工具 一个可视化程序运行行为的小工具 ⭐️⭐️ 可以参考
https://fuse.wikichip.org/ 技术博客/综合资料/专业网站 芯片资料汇总 ⭐️⭐️ 可以参考
https://hotchips.org/archives/ 技术博客/综合资料/专业网站 学术会议hotchips的资料合集 ⭐️⭐️ 可以参考
https://danluu.com/ 技术博客/综合资料/专业网站 一位大佬的个人blog ⭐️⭐️ 可以参考
https://www.brendangregg.com/dtrace.html 性能分析工具 dtrace ⭐️⭐️ 可以参考
https://profilerpedia.markhansen.co.nz/ 性能分析工具 profiler大合集 ⭐️⭐️ 可以参考
https://github.com/zouxiaohang/TheArtOFMultiprocessorProgramming 性能优化案例 多处理器编程的艺术的源代码 ⭐️⭐️ 可以参考
https://easyperf.net/blog/2018/04/03/Tools-for-microarchitectural-benchmarking 技术博客/综合资料/专业网站 CPU微架构benchmark合集 ⭐️⭐️ 可以参考
https://github.com/MattPD/cpplinks/blob/master/performance.tools.md#microarchitecture 技术博客/综合资料/专业网站 C++ Performance Tools合集 ⭐️⭐️ 可以参考
https://www.7-cpu.com/utils.html Benchmark 7z官方的cpu benchmark工具, 包括访存延迟和CPU pipeline延迟 ⭐️⭐️ 可以参考
https://www.7-cpu.com/ 技术博客/综合资料/专业网站 7z在各种CPU上的性能对比 ⭐️⭐️ 可以参考
https://www.intel.com/content/www/us/en/developer/articles/technical/intel-sdm.html 性能优化资料/书籍/论文 Intel官方IA64/32 软件性能优化手册 ⭐️⭐️ 可以参考
https://bbs.kanxue.com/thread-196228.htm 技术博客/综合资料/专业网站 Linux so hook技术汇总 ⭐️⭐️ 可以参考
https://db.in.tum.de/~finis/x86-intrin-cheatsheet-v2.1.pdf 性能优化工具 X86 intrinsics Cheat Sheet ⭐️⭐️ 可以参考
https://calcul.math.cnrs.fr/attachments/spip/IMG/pdf/Valgrind_weidendorfer.pdf 性能分析资料/书籍/论文 基于valgrind讲解如何分析和优化一个程序的访存pattern, 比较老的资料但仍然有参考价值 ⭐️⭐️ 可以参考
https://github.com/shihyu/boost/tree/master/books 技术博客/综合资料/专业网站 与boost有关的一些书籍/资料, 比较老了, 但仍有一定的参考价值 ⭐️⭐️ 可以参考
https://research.cs.wisc.edu/multifacet/papers/hpca19_gables.pdf 性能分析理论 在移动端应用roofline model的一个框架 ⭐️⭐️ 可以参考
https://github.com/trevor-vincent/awesome-high-performance-computing 技术博客/综合资料/专业网站 高性能计算资料汇总, 主要是intel/nvidia生态, arm资料极少 ⭐️⭐️ 可以参考
http://www.whigg.cas.cn/resource/program/CPP/201010/P020101023562491092566.pdf 性能优化案例 深入探讨C++语言机制对性能影响的一本书 ⭐️⭐️ 可以参考
https://github.com/mattconte/tlsf 基础库 一个号称实时的内存分配器, 短小精悍 ⭐️⭐️ 可以参考
https://bg2bkk.github.io/p/%E6%80%8E%E6%A0%B7%E5%B0%BD%E5%8F%AF%E8%83%BD%E5%85%A8%E9%9D%A2%E7%9A%84%E8%AF%84%E4%BC%B0%E4%B8%80%E5%8F%B0%E6%9C%8D%E5%8A%A1%E5%99%A8%E7%9A%84%E6%80%A7%E8%83%BD/ 性能分析案例 如何评估一个服务器的性能 ⭐️⭐️ 可以参考
https://www.brendangregg.com/methodology.html 性能分析理论 Gregg整理的性能分析方法论 ⭐️ 拓展视野
https://github.com/ros-realtime/reference-system Benchmark ROS2的参考系统, 用来做性能评估使用 ⭐️ 拓展视野
https://github.com/grafana/pyroscope 性能分析工具 持续剖析(Continuous Profiling)开源项目 ⭐️ 拓展视野
https://github.com/travisdowns/perf-test 性能分析资料/书籍/论文 量化分析perf count的示例代码, 相关的讨论在这里: https://stackoverflow.com/questions/39864416/perf-overcounting-simple-cpu-bound-loop-mysterious-kernel-work ⭐️ 拓展视野
https://github.com/OI-wiki/OI-Wiki-export/releases 性能优化资料/书籍/论文 严格来说跟性能优化关系不大, 是IO竞赛方面非常好的一个综合性wiki, 可查阅各种CS算法的实现 ⭐️ 拓展视野
https://github.com/Apress/pro-TBB 基础库 Intel TBB并行计算库的参考代码 ⭐️ 拓展视野
https://github.com/corsix/amx 性能优化案例 Apple M1/M2 AMX指令资料 ⭐️ 拓展视野
https://github.com/dougallj/applecpu 性能分析理论 Apple M1/M2 CPU架构资料 ⭐️ 拓展视野
https://github.com/flame/blis 性能优化工具 面向BLAS任务进行自动优化的计算框架 ⭐️ 拓展视野
https://github.com/billmuch/matmul_perf_test 性能优化案例 TVM与BLIS在matmul任务的性能对比 ⭐️ 拓展视野
https://xl10.github.io/blog/drcctprof.html 性能分析工具 基于二进制翻译的ARM平台性能分析工具 ⭐️ 拓展视野
http://reed.cs.depaul.edu/lperkovic/csc407/homeworks/cachelab.pdf 性能分析工具 一个cache模拟器程序 ⭐️ 拓展视野
https://bitbucket.org/berkeleylab/cs-roofline-toolkit/src/master/ 性能分析工具 自动生成Roofline Model的一个工具 有待验证
https://docs.nersc.gov/tools/performance/roofline/ 性能分析工具 上面这份工具的介绍 有待验证
https://github.com/bhhbazinga/LockFreeQueue 性能优化案例 一个lockfreequeue的实现 有待验证
https://github.com/ColinIanKing/stress-ng Benchmark 著名的linux系统压力模拟工具 有待验证
https://github.com/google/fleetbench Benchmark   有待验证
https://github.com/ColinIanKing/forkstat 性能分析工具 一个用于监控fork行为的小程序 有待验证
https://github.com/ColinIanKing/pagemon 性能分析工具 一个用于监控进程page行为的小程序 有待验证
https://github.com/ColinIanKing/faultstat 性能分析工具 一个用于监控page fault行为的小程序 有待验证
https://github.com/Irqbalance/irqbalance 性能优化工具 一个将irq均衡负载到多个cpu的程序 有待验证
https://github.com/plasma-umass/coz 性能分析工具 性能因果分析 有待验证
https://arxiv.org/pdf/1608.03676v1.pdf 性能分析理论 性能因果分析的论文 有待验证
https://github.com/KDAB/hotspot 性能分析工具 一个Linux Perf GUI工具 有待验证
https://github.com/rsy56640/triviality/tree/master/content/%E8%B0%88%E8%B0%88%E5%B9%B6%E5%8F%91 技术博客/综合资料/专业网站 一个有关并发的blog 有待验证
https://github.com/akopytov/sysbench 性能分析工具 制造各种系统负载的工具 有待验证
https://github.com/strasdat/Sophus 基础库 一个2D/3D几何计算库 有待验证
https://github.com/songqun/speedup-aarch64-cpu 性能分析资料/书籍/论文 一个conv的快速实现 有待验证
https://github.com/chronoxor/CppBenchmark Benchmark 另一个C++ Benchmark框架 有待验证
https://github.com/deepsea-inria/pasl 基础库 一个并行计算基础库 有待验证
https://github.com/ParRes/Kernels 基础库   有待验证
https://github.com/GeorgOfenbeck/perfplot     有待验证
https://baptiste-wicht.com/posts/2017/05/cpp-containers-benchmark-vector-list-deque-plf-colony.html Benchmark    
https://baptiste-wicht.com/categories/c%2B%2B.html 技术博客/综合资料/专业网站    
https://github.com/facebook/folly/blob/main/folly/docs/small_vector.md