HBM의 경우 게임용에서는 거의 체감 성능이 없고,
빅 데이터와 AI 병렬 처리에서 많이 사용될것으로 기대 되는데,
HBM 16단 스택으로 쌓아 올린것은 발열을 잡을수가 없어서, 테스트에 떨어지면서,
사실상 가치가 없는 기술이 되었어.
HBM 4096단으로 올린것과 같은 성능을 가진 HBM 4096단을 1년안에 양산이 가능하지.
아니, 40960단, 409600단과 같은 성능을 가진 HBM을 만들수도 있어.
당장이라도 말이지.
왜냐면 HBM은 같은 칩셋의 쌓아 올린것에 불과하기 때문이야.
특별한 기술이 들어가있는게 아니라는거지.
그래서 이 문제를 해결하기 위해서 HBM에 양면 공정을 사용하는데,
GPU 윗 면에는 GPU를 두고, HBM를 장착하는 부분을 램 슬롯처럼 GPU 아래로 빼는거야.
그리고 HBM 램을 그 슬롯에 끼워넣는거지.
이 슬롯 한개에 I/O 입출력단자를 20480개~40960개로 만드는데, 4채널을 지원하는거야.
그러면 20480개 X 4채널하면 입출력 단자가 81920개~ 163840개로 늘어나는거지.
HBM의 램에서 최대 적층은 4층인데, 그 이상 올려봐야 의미가 없기 때문이야. 발열만 높아질뿐이닌깐,
4채널이 부족하면 8채널로 하면 되는문제지.
HBM 램은 양 옆으로 4단으로 적층되어있는 HBM 램을 끼워넣는데,
양 옆에 4층 HBM 125개씩을 설치해서 1개당 1000개의 HBM이 장착된 램을 만드는거야.
그러면 이 HBM램을 4개 끼워넣으면 4000HBM의 성능을 가지게 되는거지.
발열을 잡기 위해서 램 메모리 HBM은 최대 4단까지만 높이고, HBM 램에 촘촘하게 설치하고,
GPU보다 더 큰 쿨러를 설치해서, 발열을 잡는거지.
4천단위 HBM 모습을 보면 이런 형태야.
이 그림에서 2채널로 GPU와 HBM이 연결되어있어.
윗 GPU에 2개의 대형 팬 쿨러가 장착되어있고, 아래 HBM에도 대형 팬 2개의 쿨러가 장착되어있지.
HBM이 2048단~4096단까지 넣으면 HBM의 두께가 커지겠지.
거리가 멀어지면서 지연 속도는 생기겠지만, 클럭을 높이면 되는 문제고,
대역폭이 기하 급수적으로 높아져서, AI와 빅데이터용으로 적합한거야.
AI와 빅데이터용으로 문제가 없다는거지.
그러면 4096단 HBM의 경우 GPU보다 2배~4배 두께를 가지게 되는데, 이때 발열을 잡기 위해서,
HBM에서 전류가 통하는곳에는 비전도성 서멀구리스를 바르고, 전류가 흐르지 않는곳에 전도성 서멀구리스를 발라,
열전도율을 최적화 해서, 쿨러를 통해 열을 방출하는거지.
써멀구리스로 하지 않고, 열전도율이 높은 물질로 납땜을 해도 되는 문제야.
이렇게 만들면 GPU와 HBM을 분리할수있게 되고, GPU에 HBM을 장착해 끼우는 방식으로 만들어지는거지.
현재 상용화 하려는 HBM 12단은 한계가 분명한데, 소자 크기를 더이상 줄이는게 아니기 때문에,
지금 당장이라도 이렇게 분리 조립형으로 HBM을 설계하고 만들면 2048단,4096단급 HBM을 만들수 있으며,
10만단위, 100만 단위의 HBM도 만들수도있어.
그런데 그만큼 GPU가 처리할수있는 능력의 한계가 있어서, 병목 현상이 생기고,
메모리 대역폭을 제대로 활용하지 못해서, GPU 칩을 10배로 넣을수도있지.
그리고 HBM 램 전체에 냉각펜이 GPU보다 훨씬 크게 만들어지고, 보조 전원선을 HBM에 장착해야 겠지.
10년은 지나야 만들수있다는 HBM 40 4096단, 1년안에 상용화 할수있는데
HBM 400 40960단급도 1년안에 상용화 할수있어.
그러면 그만큼 크기가 커지고 전력 소비가 늘어나겠지.
삼성이 GPU 그래픽 밑에 HBM 2~4개를 장착한 16000단급 HBM을 당장 출시할수있다면
반도체 시장을 완전히 장악하고 전세계 반도체 패권을 장악할수있어.
최소 10년 앞선 초격차 초혁신 기술로 평가되어 주식 가치가 20배 이상 오를수도있어.