链接 | 类别 | 推荐理由 | 业务可用性 |
---|---|---|---|
https://www.brendangregg.com/perf.html | 性能分析工具 | linux perf大佬brendangregg官方网站 | ⭐️⭐️⭐️⭐️⭐️ 强烈推荐 |
https://perfetto.dev/ | 性能分析工具 | Android和Chrome内置性能分析平台 | ⭐️⭐️⭐️⭐️⭐️ 强烈推荐 |
https://github.com/google/benchmark | Benchmark | Google benchmark框架 | ⭐️⭐️⭐️⭐️⭐️ 强烈推荐 |
https://quick-bench.com/q/G7B2w0xPUWgOVvuzI7unES6cU4w | 性能分析工具 | 一个针对C++ benchmark的在线工具 | ⭐️⭐️⭐️⭐️⭐️ 强烈推荐 |
https://github.com/facontidavide/CPP_Optimizations_Diary | 性能优化案例 | 高性能C++编程的一些例子 | ⭐️⭐️⭐️⭐️⭐️ 强烈推荐 |
https://godbolt.org/ | 性能分析工具 | 著名的在线编译器行为分析网站 | ⭐️⭐️⭐️⭐️⭐️ 强烈推荐 |
https://github.com/brendangregg/FlameGraph | 性能分析工具 | 火焰图, 无需过多介绍 | ⭐️⭐️⭐️⭐️⭐️ 强烈推荐 |
https://github.com/Netflix/flamescope | 性能分析工具 | 火焰图的scope版本 | ⭐️⭐️⭐️⭐️⭐️ 强烈推荐 |
https://github.com/brendangregg/perf-tools | 性能分析工具 | Gregg性能分析工具合集 | ⭐️⭐️⭐️⭐️⭐️ 强烈推荐 |
https://github.com/mtrebi/memory-allocators | 基础库 | 内存分配器合集 | ⭐️⭐️⭐️⭐️⭐️ 强烈推荐 |
https://github.com/taskflow/taskflow | 基础库 | 著名的C++ DAG异步调度与并行计算库 | ⭐️⭐️⭐️⭐️⭐️ 强烈推荐 |
https://github.com/gperftools/gperftools | 性能分析工具 | Google gperftools | ⭐️⭐️⭐️⭐️⭐️ 强烈推荐 |
https://github.com/namhyung/uftrace | 性能分析工具 | User Space Ftrace, 可基于function instrumentatin或者plt hook动态获取函数执行行为 | ⭐️⭐️⭐️⭐️⭐️ 强烈推荐 |
https://github.com/google/tcmalloc | 基础库 | Google Tcmalloc开源版本 | ⭐️⭐️⭐️⭐️⭐️ 强烈推荐 |
https://github.com/thenifty/neon-guide | 性能优化案例 | 非常干货的NEON优化示例 | ⭐️⭐️⭐️⭐️⭐️ 强烈推荐 |
https://github.com/andikleen/pmu-tools | 性能分析工具 | Andi Kleen的Top-Down分析工具 | ⭐️⭐️⭐️⭐️⭐️ 强烈推荐 |
https://github.com/jlfwong/speedscope | 性能分析工具 | 火焰图的web可视化界面, 类似systrace/perfetto | ⭐️⭐️⭐️⭐️⭐️ 强烈推荐 |
https://champyen.blogspot.com/ | 技术博客/综合资料/专业网站 | 一位台湾大哥的blog, 擅长面向底层的性能优化技巧 | ⭐️⭐️⭐️⭐️⭐️ 强烈推荐 |
https://easyperf.net/notes/ | 技术博客/综合资料/专业网站 | PATMC作者个人blog | ⭐️⭐️⭐️⭐️⭐️ 强烈推荐 |
https://gitlab.arm.com/telemetry-solution/telemetry-solution/-/tree/main/tools/topdown_tool | 性能分析工具 | ARM官方top-down分析工具, 目前只支持Neoverse, 但A55也可以用. 需要板端支持python | ⭐️⭐️⭐️⭐️⭐️ 强烈推荐 |
https://github.com/MegEngine/MegPeak | Benchmark | 旷视开源的CPU指令 latency/throughput测试程序 | ⭐️⭐️⭐️⭐️⭐️ 强烈推荐 |
https://dokumen.tips/documents/simd-assembly-tutorial-arm-neon-xiphorg.html?page=1 | 性能优化案例 | Mozilla的一份ARM Neon教程, 比较老但是干货很多 | ⭐️⭐️⭐️⭐️⭐️ 强烈推荐 |
https://users.ece.cmu.edu/~franzf/papers/gttse07.pdf | 性能分析资料/书籍/论文 | 详细讲解如何优化数值计算程序的一篇综述 | ⭐️⭐️⭐️⭐️⭐️ 强烈推荐 |
https://github.com/intel/ARM_NEON_2_x86_SSE | 基础库 | ARM NEON和X86 SSE转换库 | ⭐️⭐️⭐️⭐️ 值得一试 |
https://github.com/JonathanSalwan/PinTools | 性能分析工具 | Intel Binary Instrumentation Tools | ⭐️⭐️⭐️⭐️ 值得一试 |
https://github.com/pigirons/cpufp | 性能优化案例 | CPU浮点算力峰值测速程序, 作者是商汤HPC负责人高叔叔 | ⭐️⭐️⭐️⭐️ 值得一试 |
https://github.com/apache/tvm | 性能优化工具 | 目前非常主流的自动编译与优化框架 | ⭐️⭐️⭐️⭐️ 值得一试 |
https://github.com/koute/bytehound | 性能分析工具 | 一个非常强大的内存泄露分析与统计工具, 支持内嵌DSL | ⭐️⭐️⭐️⭐️ 值得一试 |
https://github.com/ARM-software/HWCPipe | 性能分析工具 | ARM官方的PMU API封装 | ⭐️⭐️⭐️⭐️ 值得一试 |
https://github.com/0xddaa/pin | 性能分析工具 | 基于intel pintools的一些应用案例 | ⭐️⭐️⭐️⭐️ 值得一试 |
https://github.com/andikleen/simple-pt | 性能分析工具 | Intel Processor Trace工具 | ⭐️⭐️⭐️⭐️ 值得一试 |
https://github.com/bluealert/MetaNN-book | 性能优化资料/书籍/论文 | 深入介绍表达式模板技术的一本书 | ⭐️⭐️⭐️⭐️ 值得一试 |
https://lemire.me/blog/2017/07/10/pruning-spaces-faster-on-arm-processors-with-vector-table-lookups/ | 性能优化案例 | ARM Neon的一个优化例子 | ⭐️⭐️⭐️⭐️ 值得一试 |
https://github.com/bytedance/btrace | 性能分析工具 | 字节开源的trace工具 | ⭐️⭐️⭐️⭐️ 值得一试 |
https://github.com/travisdowns/uarch-bench | Benchmark | 一个CPU微架构benchmark工具集 | ⭐️⭐️⭐️⭐️ 值得一试 |
https://llvm.org/doxygen/classllvm_1_1SmallVector.html | 基础库 | LLVM内置的small vector实现 | ⭐️⭐️⭐️⭐️ 值得一试 |
https://flatbuffers.dev/flatbuffers_benchmarks.html | Benchmark | flatbuffers benchmark数据 | ⭐️⭐️⭐️⭐️ 值得一试 |
https://github.com/RRZE-HPC/ibench | Benchmark | 一个测试X86/ARM CPU latency/throughput的程序, 纯汇编实现 | ⭐️⭐️⭐️⭐️ 值得一试 |
https://github.com/powturbo/Turbo-Run-Length-Encoding | 基础库 | 一个非常快速的rle实现 | ⭐️⭐️⭐️⭐️ 值得一试 |
https://github.com/Maratyszcza/FP16/tree/master | 基础库 | 一个完整的fp16数据格式转换库, 支持arm和x86 | ⭐️⭐️⭐️⭐️ 值得一试 |
https://people.eecs.berkeley.edu/~kubitron/cs252/handouts/papers/RooflineVyNoYellow.pdf | 性能分析理论 | Roofline Model的原始论文 | ⭐️⭐️⭐️ 建议精读 |
https://www.nersc.gov/assets/Uploads/Tutorial-ISC2019-Intro-v2.pdf | 性能分析理论 | 关于Roofline Model的一个talk | ⭐️⭐️⭐️ 建议精读 |
https://dando18.github.io/posts/2020/04/02/roofline-model | 性能分析理论 | 关于Roofline Model的一个博客 | ⭐️⭐️⭐️ 建议精读 |
https://crd.lbl.gov/assets/pubs_presos/parlab08-roofline-talk.pdf | 性能分析理论 | 关于Roofline Model的一个talk | ⭐️⭐️⭐️ 建议精读 |
https://www.spiral.net/software/roofline.html | 性能分析理论 | 基于测试数据生成Roofline Model的一个尝试 | ⭐️⭐️⭐️ 建议精读 |
https://spiral.ece.cmu.edu/pub-spiral/pubfile/paper_181.pdf | 性能分析理论 | 基于Roofline Model, 在微架构层面进行性能瓶颈分析的一篇论文 | ⭐️⭐️⭐️ 建议精读 |
https://research.google/pubs/pub44271/ | 性能分析理论 | Google的一篇论文, 分析了20000台服务器在3年内的负载情况, 在性能分析方面有非常高的视野(和钞能力…) | ⭐️⭐️⭐️ 建议精读 |
https://mirrors.edge.kernel.org/pub/linux/kernel/people/paulmck/perfbook/perfbook.html | 性能分析理论 | 并行编程著名读物,perf-book, 全称是 Is Parallel Programming Hard, And, If So, What Can You Do About It? | ⭐️⭐️⭐️ 建议精读 |
https://github.com/rsy56640/triviality/tree/master/content/perf-book | 技术博客/综合资料/专业网站 | perf-book读后感 | ⭐️⭐️⭐️ 建议精读 |
https://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.112.6406&rep=rep1&type=pdf | 性能优化案例 | Hazard Pointer的一个应用例子 | ⭐️⭐️⭐️ 建议精读 |
https://queue.acm.org/detail.cfm?id=2413037 | 技术博客/综合资料/专业网站 | Greeg的一篇文章, 综述性能分析的方法论 | ⭐️⭐️⭐️ 建议精读 |
https://github.com/downdemo/Cpp-Concurrency-in-Action-2ed | 性能分析理论 | CPP并发编程 | ⭐️⭐️⭐️ 建议精读 |
https://github.com/tpoisonooo/how-to-optimize-gemm | 性能优化案例 | GEMM优化的一个案例, 循序渐进版本 | ⭐️⭐️⭐️ 建议精读 |
http://halobates.de/blog/ | 技术博客/综合资料/专业网站 | Andi Kleen个人blog | ⭐️⭐️⭐️ 建议精读 |
https://www.lei.chat/ | 技术博客/综合资料/专业网站 | 一位在google负责IREE相关工作的个人blog | ⭐️⭐️⭐️ 建议精读 |
https://zhenhuaw.me/blog/2019/gemm-optimization.html | 性能优化案例 | 一个GEMM优化案例 | ⭐️⭐️⭐️ 建议精读 |
https://easyperf.net/blog/2019/10/05/Performance-Analysis-Of-MT-apps | 性能分析资料/书籍/论文 | 多线程程序分析案例 | ⭐️⭐️⭐️ 建议精读 |
https://resources.linaro.org/zh/resource/Vi6mFmZgTfjKH6C6HhsmBa | 性能分析工具 | ARM SPE介绍, J6会搭载 | ⭐️⭐️⭐️ 建议精读 |
https://resources.linaro.org/zh/resource/uy5kkd5W1NJ1UhxsevgBNN | 性能优化案例 | ARM平台Numpy优化的一个例子 | ⭐️⭐️⭐️ 建议精读 |
https://hal.science/hal-01915529/document | 性能优化案例 | Data Layout与SIMD优化的综述 | ⭐️⭐️⭐️ 建议精读 |
---|---|---|---|
https://github.com/charguer/aosoa-demo | 性能优化案例 | 展示SOA/AOS对性能优化的影响 | ⭐️⭐️⭐️ 建议精读 |
https://www.androidperformance.com/ | 技术博客/综合资料/专业网站 | Android性能优化网站 | ⭐️⭐️⭐️ 建议精读 |
https://www.brendangregg.com/blog/2020-07-15/systems-performance-2nd-edition.html | 技术博客/综合资料/专业网站 | Gregg大佬的系统性能分析书籍 | ⭐️⭐️⭐️ 建议精读 |
https://github.com/PacktPublishing/Cpp-High-Performance | 技术博客/综合资料/专业网站 | C++ high performance书籍配套代码 | ⭐️⭐️⭐️ 建议精读 |
https://www.packtpub.com/product/c-high-performance-second-edition/9781839216541 | 技术博客/综合资料/专业网站 | C++ high performance Programming | ⭐️⭐️⭐️ 建议精读 |
https://www.aristeia.com/TalkNotes/codedive-CPUCachesHandouts.pdf | 技术博客/综合资料/专业网站 | 介绍CPU Cache的经典资料 | ⭐️⭐️⭐️ 建议精读 |
https://developer.arm.com/documentation/EPM128372/0300/?lang=en | 技术博客/综合资料/专业网站 | ARM A55软件优化指南 | ⭐️⭐️⭐️ 建议精读 |
https://developer.arm.com/documentation/100442/latest/ | 技术博客/综合资料/专业网站 | ARM A55 Technical Reference Manual | ⭐️⭐️⭐️ 建议精读 |
https://faculty.cc.gatech.edu/~hyesoon/lee_taco12.pdf | 技术博客/综合资料/专业网站 | 专门讲解prefetch机制的一篇论文 | ⭐️⭐️⭐️ 建议精读 |
https://www.researchgate.net/publication/269302126_A_Top-Down_method_for_performance_analysis_and_counters_architecture | 性能分析理论 | Ashin的top-down分析理论原始论文 | ⭐️⭐️⭐️ 建议精读 |
https://scholar.google.com/citations?view_op=view_citation&hl=en&user=yeiYmAUAAAAJ&citation_for_view=yeiYmAUAAAAJ:qjMakFHDy7sC | 性能分析资料/书籍/论文 | 对Google数万台服务器的frontend stall分析论文 | ⭐️⭐️⭐️ 建议精读 |
https://www.agner.org/optimize/optimizing_cpp.pdf | 性能优化案例 | Agner Fog关于高性能C++编程的一本书 | ⭐️⭐️⭐️ 建议精读 |
https://www.intel.com/content/dam/develop/external/us/en/documents/performance-analysis-guide-181827.pdf | 性能分析资料/书籍/论文 | Intel i7 CPU性能分析指南 | ⭐️⭐️⭐️ 建议精读 |
https://sites.google.com/lbl.gov/cs267-spr2018/ | 技术博客/综合资料/专业网站 | UC Berkeley 2018 并行计算课程, cs267 | ⭐️⭐️⭐️ 建议精读 |
https://pdfcoffee.com/embedded-systems-arm-programming-and-optimization-pdf-free.html | 技术博客/综合资料/专业网站 | 一本面向ARM平台的性能分析的书 | ⭐️⭐️⭐️ 建议精读 |
https://www.gooneyryan.com/download/boost%E7%A8%8B%E5%BA%8F%E5%BA%93%E5%AE%8C%E5%85%A8%E5%BC%80%E5%8F%91%E6%8C%87%E5%8D%97%EF%BC%9A%E6%B7%B1%E5%85%A5c%E5%87%86%E6%A0%87%E5%87%86%E5%BA%93 | 技术博客/综合资料/专业网站 | Boost标准库深入开发指南, 第三版, 主要是C++11和14, 与我们业务比较贴近. 值得学一学如何封装高性能C++类 | ⭐️⭐️⭐️ 建议精读 |
https://www.cs.cmu.edu/afs/cs/academic/class/15210-f15/www/tapp.html | 性能优化案例 | CMU并行编程课程15210 | ⭐️⭐️⭐️ 建议精读 |
Structured Parallel Programming - Patterns for Effieicnt Computation | 性能优化资料/书籍/论文 | 取 | ⭐️⭐️⭐️ 建议精读 |
https://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.395.378&rep=rep1&type=pdf | 性能优化资料/书籍/论文 | Hazard Pointer, 无锁编程的一种重要组件 | ⭐️⭐️ 可以参考 |
https://github.com/facebook/folly | 基础库 | Meta开源的C++基础库, 有很多并行编程相关的高性能实现 | ⭐️⭐️ 可以参考 |
---|---|---|---|
https://github.com/CodingHanYa/workspace | 基础库 | 一个C++实现的异步编程框架 | ⭐️⭐️ 可以参考 |
https://github.com/google/pprof | 性能分析工具 | Google的profiling数据中间协议 | ⭐️⭐️ 可以参考 |
https://github.com/MegEngine/mperf | 性能分析工具 | 旷视开源的一套ARM平台roofline/top-down分析工具 | ⭐️⭐️ 可以参考 |
https://github.com/Juude/awesome-android-performance | 性能分析资料/书籍/论文 | Android Performance相关的资料汇总 | ⭐️⭐️ 可以参考 |
https://github.com/ARM-software/workload-automation | 性能分析工具 | ARM针对Android提供的一些workload | ⭐️⭐️ 可以参考 |
https://github.com/kfrlib/kfr | 基础库 | 一个C++ DSP计算框架 | ⭐️⭐️ 可以参考 |
https://github.com/google/gemmlowp | 基础库 | Google的低精度量化Gemm计算库 | ⭐️⭐️ 可以参考 |
https://www.intel.com/content/www/us/en/docs/vtune-profiler/cookbook/2023-0/top-down-microarchitecture-analysis-method.html#top-down-microarchitecture-analysis-method_GUID-FA8F07A1-3590-4A91-864D-CE96456F84D7 | 性能分析工具 | Intel官方的vtune工具 | ⭐️⭐️ 可以参考 |
https://github.com/jmpews/Dobby | 性能分析工具 | 一个跨平台hook框架 | ⭐️⭐️ 可以参考 |
https://github.com/DynamoRIO/dynamorio | 性能分析工具 | ARM平台著名的binary instrumentation工具 | ⭐️⭐️ 可以参考 |
https://github.com/p12tic/libsimdpp | 基础库 | C++ SIMD封装 | ⭐️⭐️ 可以参考 |
https://github.com/VcDevel/Vc | 基础库 | 另一个C++ SIMD/并行计算封装 | ⭐️⭐️ 可以参考 |
https://github.com/VcDevel/std-simd | 基础库 | 另一个C++ SIMD/并行计算封装 | ⭐️⭐️ 可以参考 |
https://github.com/xtensor-stack/xsimd | 基础库 | 另一个C++ SIMD/并行计算封装 | ⭐️⭐️ 可以参考 |
https://github.com/shibatch/sleef | 基础库 | C标准数学库的并行实现版本 | ⭐️⭐️ 可以参考 |
https://github.com/sharkdp/hyperfine | Benchmark | 一个命令行benchmark程序 | ⭐️⭐️ 可以参考 |
https://github.com/openmlsys/openmlsys-zh | 技术博客/综合资料/专业网站 | 开源深度学习系统平台教程 | ⭐️⭐️ 可以参考 |
https://github.com/google/bloaty | 性能分析工具 | 二进制size profiling tool | ⭐️⭐️ 可以参考 |
https://github.com/tpn/pdfs | 性能分析理论 | CS相关pdf大合集 | ⭐️⭐️ 可以参考 |
https://github.com/MegEngine/MegCC | 基础库 | 旷视开源的NN推理框架, 用代码生成的方式, 做到了极小的binary size和不错的性能 | ⭐️⭐️ 可以参考 |
---|---|---|---|
https://github.com/flame/blislab | 性能优化案例 | GEMM优化沙箱 | ⭐️⭐️ 可以参考 |
https://github.com/janestreet/magic-trace | 性能分析工具 | 一个魔改版本的systrace | ⭐️⭐️ 可以参考 |
https://github.com/tpoisonooo/chgemm | 性能优化案例 | 魔改版本的int8 gemm实现 | ⭐️⭐️ 可以参考 |
https://github.com/zchrissirhcz/smallcv | 基础库 | 一个非常精简的cv库, 兼容opencv | ⭐️⭐️ 可以参考 |
https://github.com/microsoft/perfview | 性能分析工具 | 微软的一套性能分析套件 | ⭐️⭐️ 可以参考 |
https://github.com/Dr-Noob/cpufetch | 性能分析工具 | 获取CPU微架构参数的小程序 | ⭐️⭐️ 可以参考 |
https://github.com/simdjson/simdjson | 性能优化案例 | SIMD版本的json parser库, 但据说跨平台一致性不好 | ⭐️⭐️ 可以参考 |
https://github.com/lemire/simple_fastfloat_benchmark | Benchmark | fastfloat benchmark | ⭐️⭐️ 可以参考 |
https://github.com/fastfloat/fast_float | 性能优化案例 | float字符串解析的快速实现 | ⭐️⭐️ 可以参考 |
https://github.com/ARM-software/gator | 性能分析工具 | ARM Mobile Studio在板端的wrapper程序 | ⭐️⭐️ 可以参考 |
https://github.com/ARM-software/synchronization-benchmarks | Benchmark | ARM官方的同步相关用例benchmark | ⭐️⭐️ 可以参考 |
https://github.com/ARM-software/HPCG_for_Arm | Benchmark | ARM官方的HPC负载测试程序 | ⭐️⭐️ 可以参考 |
https://github.com/bytedance/bhook | 性能分析工具 | 字节开源的hook框架 | ⭐️⭐️ 可以参考 |
https://github.com/wolfpld/tracy | 性能分析工具 | 一个面向游戏的性能分析框架 | ⭐️⭐️ 可以参考 |
https://bitbucket.org/oebeling/tracectory/wiki/Home | 性能分析工具 | 一个可视化程序运行行为的小工具 | ⭐️⭐️ 可以参考 |
https://fuse.wikichip.org/ | 技术博客/综合资料/专业网站 | 芯片资料汇总 | ⭐️⭐️ 可以参考 |
https://hotchips.org/archives/ | 技术博客/综合资料/专业网站 | 学术会议hotchips的资料合集 | ⭐️⭐️ 可以参考 |
https://danluu.com/ | 技术博客/综合资料/专业网站 | 一位大佬的个人blog | ⭐️⭐️ 可以参考 |
https://www.brendangregg.com/dtrace.html | 性能分析工具 | dtrace | ⭐️⭐️ 可以参考 |
https://profilerpedia.markhansen.co.nz/ | 性能分析工具 | profiler大合集 | ⭐️⭐️ 可以参考 |
---|---|---|---|
https://github.com/zouxiaohang/TheArtOFMultiprocessorProgramming | 性能优化案例 | 多处理器编程的艺术的源代码 | ⭐️⭐️ 可以参考 |
https://easyperf.net/blog/2018/04/03/Tools-for-microarchitectural-benchmarking | 技术博客/综合资料/专业网站 | CPU微架构benchmark合集 | ⭐️⭐️ 可以参考 |
https://github.com/MattPD/cpplinks/blob/master/performance.tools.md#microarchitecture | 技术博客/综合资料/专业网站 | C++ Performance Tools合集 | ⭐️⭐️ 可以参考 |
https://www.7-cpu.com/utils.html | Benchmark | 7z官方的cpu benchmark工具, 包括访存延迟和CPU pipeline延迟 | ⭐️⭐️ 可以参考 |
https://www.7-cpu.com/ | 技术博客/综合资料/专业网站 | 7z在各种CPU上的性能对比 | ⭐️⭐️ 可以参考 |
https://www.intel.com/content/www/us/en/developer/articles/technical/intel-sdm.html | 性能优化资料/书籍/论文 | Intel官方IA64/32 软件性能优化手册 | ⭐️⭐️ 可以参考 |
https://bbs.kanxue.com/thread-196228.htm | 技术博客/综合资料/专业网站 | Linux so hook技术汇总 | ⭐️⭐️ 可以参考 |
https://db.in.tum.de/~finis/x86-intrin-cheatsheet-v2.1.pdf | 性能优化工具 | X86 intrinsics Cheat Sheet | ⭐️⭐️ 可以参考 |
https://calcul.math.cnrs.fr/attachments/spip/IMG/pdf/Valgrind_weidendorfer.pdf | 性能分析资料/书籍/论文 | 基于valgrind讲解如何分析和优化一个程序的访存pattern, 比较老的资料但仍然有参考价值 | ⭐️⭐️ 可以参考 |
https://github.com/shihyu/boost/tree/master/books | 技术博客/综合资料/专业网站 | 与boost有关的一些书籍/资料, 比较老了, 但仍有一定的参考价值 | ⭐️⭐️ 可以参考 |
https://research.cs.wisc.edu/multifacet/papers/hpca19_gables.pdf | 性能分析理论 | 在移动端应用roofline model的一个框架 | ⭐️⭐️ 可以参考 |
https://github.com/trevor-vincent/awesome-high-performance-computing | 技术博客/综合资料/专业网站 | 高性能计算资料汇总, 主要是intel/nvidia生态, arm资料极少 | ⭐️⭐️ 可以参考 |
http://www.whigg.cas.cn/resource/program/CPP/201010/P020101023562491092566.pdf | 性能优化案例 | 深入探讨C++语言机制对性能影响的一本书 | ⭐️⭐️ 可以参考 |
https://github.com/mattconte/tlsf | 基础库 | 一个号称实时的内存分配器, 短小精悍 | ⭐️⭐️ 可以参考 |
https://bg2bkk.github.io/p/%E6%80%8E%E6%A0%B7%E5%B0%BD%E5%8F%AF%E8%83%BD%E5%85%A8%E9%9D%A2%E7%9A%84%E8%AF%84%E4%BC%B0%E4%B8%80%E5%8F%B0%E6%9C%8D%E5%8A%A1%E5%99%A8%E7%9A%84%E6%80%A7%E8%83%BD/ | 性能分析案例 | 如何评估一个服务器的性能 | ⭐️⭐️ 可以参考 |
https://www.brendangregg.com/methodology.html | 性能分析理论 | Gregg整理的性能分析方法论 | ⭐️ 拓展视野 |
https://github.com/ros-realtime/reference-system | Benchmark | ROS2的参考系统, 用来做性能评估使用 | ⭐️ 拓展视野 |
https://github.com/grafana/pyroscope | 性能分析工具 | 持续剖析(Continuous Profiling)开源项目 | ⭐️ 拓展视野 |
https://github.com/travisdowns/perf-test | 性能分析资料/书籍/论文 | 量化分析perf count的示例代码, 相关的讨论在这里: https://stackoverflow.com/questions/39864416/perf-overcounting-simple-cpu-bound-loop-mysterious-kernel-work | ⭐️ 拓展视野 |
https://github.com/OI-wiki/OI-Wiki-export/releases | 性能优化资料/书籍/论文 | 严格来说跟性能优化关系不大, 是IO竞赛方面非常好的一个综合性wiki, 可查阅各种CS算法的实现 | ⭐️ 拓展视野 |
---|---|---|---|
https://github.com/Apress/pro-TBB | 基础库 | Intel TBB并行计算库的参考代码 | ⭐️ 拓展视野 |
https://github.com/corsix/amx | 性能优化案例 | Apple M1/M2 AMX指令资料 | ⭐️ 拓展视野 |
https://github.com/dougallj/applecpu | 性能分析理论 | Apple M1/M2 CPU架构资料 | ⭐️ 拓展视野 |
https://github.com/flame/blis | 性能优化工具 | 面向BLAS任务进行自动优化的计算框架 | ⭐️ 拓展视野 |
https://github.com/billmuch/matmul_perf_test | 性能优化案例 | TVM与BLIS在matmul任务的性能对比 | ⭐️ 拓展视野 |
https://xl10.github.io/blog/drcctprof.html | 性能分析工具 | 基于二进制翻译的ARM平台性能分析工具 | ⭐️ 拓展视野 |
http://reed.cs.depaul.edu/lperkovic/csc407/homeworks/cachelab.pdf | 性能分析工具 | 一个cache模拟器程序 | ⭐️ 拓展视野 |
https://bitbucket.org/berkeleylab/cs-roofline-toolkit/src/master/ | 性能分析工具 | 自动生成Roofline Model的一个工具 | 有待验证 |
https://docs.nersc.gov/tools/performance/roofline/ | 性能分析工具 | 上面这份工具的介绍 | 有待验证 |
https://github.com/bhhbazinga/LockFreeQueue | 性能优化案例 | 一个lockfreequeue的实现 | 有待验证 |
https://github.com/ColinIanKing/stress-ng | Benchmark | 著名的linux系统压力模拟工具 | 有待验证 |
https://github.com/google/fleetbench | Benchmark | 有待验证 | |
https://github.com/ColinIanKing/forkstat | 性能分析工具 | 一个用于监控fork行为的小程序 | 有待验证 |
https://github.com/ColinIanKing/pagemon | 性能分析工具 | 一个用于监控进程page行为的小程序 | 有待验证 |
https://github.com/ColinIanKing/faultstat | 性能分析工具 | 一个用于监控page fault行为的小程序 | 有待验证 |
https://github.com/Irqbalance/irqbalance | 性能优化工具 | 一个将irq均衡负载到多个cpu的程序 | 有待验证 |
https://github.com/plasma-umass/coz | 性能分析工具 | 性能因果分析 | 有待验证 |
https://arxiv.org/pdf/1608.03676v1.pdf | 性能分析理论 | 性能因果分析的论文 | 有待验证 |
https://github.com/KDAB/hotspot | 性能分析工具 | 一个Linux Perf GUI工具 | 有待验证 |
https://github.com/rsy56640/triviality/tree/master/content/%E8%B0%88%E8%B0%88%E5%B9%B6%E5%8F%91 | 技术博客/综合资料/专业网站 | 一个有关并发的blog | 有待验证 |
---|---|---|---|
https://github.com/akopytov/sysbench | 性能分析工具 | 制造各种系统负载的工具 | 有待验证 |
https://github.com/strasdat/Sophus | 基础库 | 一个2D/3D几何计算库 | 有待验证 |
https://github.com/songqun/speedup-aarch64-cpu | 性能分析资料/书籍/论文 | 一个conv的快速实现 | 有待验证 |
https://github.com/chronoxor/CppBenchmark | Benchmark | 另一个C++ Benchmark框架 | 有待验证 |
https://github.com/deepsea-inria/pasl | 基础库 | 一个并行计算基础库 | 有待验证 |
https://github.com/ParRes/Kernels | 基础库 | 有待验证 | |
https://github.com/GeorgOfenbeck/perfplot | 有待验证 | ||
https://baptiste-wicht.com/posts/2017/05/cpp-containers-benchmark-vector-list-deque-plf-colony.html | Benchmark | ||
https://baptiste-wicht.com/categories/c%2B%2B.html | 技术博客/综合资料/专业网站 | ||
https://github.com/facebook/folly/blob/main/folly/docs/small_vector.md |