포럼에서는 코어와 클럭 속도에 대한 이야기가 많지만, 결정적인 요소 하나가 간과되곤 합니다: 프로세서의 캐시 메모리입니다. 이 초고속 내장 메모리는 계층적으로 구성되어 코어가 지속적으로 RAM에 의존하지 않고도 데이터를 공급하는 역할을 합니다. 그 설계는 특히 데이터 접근이 대규모로 지속적으로 이루어지는 게임과 고사양 소프트웨어에서 원활함에 직접적인 영향을 미칩니다.
캐시 계층 구조: L1부터 L3까지, 캐시 미스 최소화하기 🧠
효율성은 계층 구조에 있습니다. 가장 작고 빠른 L1 캐시는 각 코어에 전용으로 할당됩니다. 더 큰 대기 시간과 용량을 가진 L2 캐시는 일반적으로 코어 그룹이 공유합니다. 가장 크며 전체 칩에 서비스를 제공하는 것은 L3 또는 공유 캐시입니다. 코어가 데이터가 필요할 때는 이 순서대로 찾습니다. 데이터를 찾지 못하면 캐시 미스가 발생하여 수백 사이클이나 더 느린 RAM 접근을 강제합니다. 넓고 잘 관리된 캐시는 이러한 실패를 줄여줍니다.
당신의 CPU가 RAM 관광을 해야 할 때 🐌
이것은 극적인 순간입니다: 캐시의 속도에 익숙해진 당신의 프로세서가 찾는 것을 발견하지 못합니다. 그러면 먼 땅인 RAM으로의 느리고 무거운 여행을 시작하는데, 이 여행은 클럭 사이클로 치면 지구 중심으로의 탐험과 같습니다. 그동안 코어들은 허공을 바라보며, FPS는 주저하고, 당신은 문제가 그래픽 카드에 있다고 생각합니다. 캐시는 바로 그 효율적인 웨이터로, 주방(CPU)이 재료 하나하나마다 시장(RAM)에 가야 하는 것을 막아줍니다.