Session

· Contributors · Organizations · Search Program · Flagged · Happening Now

Research Manuscript: Where Processing-in-Memory Fits Best in the System

Session Chairs

Pohang University of Science and Technology (POSTECH)

DescriptionProcessing-in-memory (PIM) greatly improves performance and efficiency, but only when coupled with thorough considerations from the perspective of the entire system. The first two papers suggest solutions to accelerate recommendation models using PIM hardware. The third paper presents a near-data computing method to accelerate Mixture-of-Experts LLM inference, followed by the fourth paper which introduces a framework for efficiently realizing bulk bitwise operations in NVMs. The last two papers discuss SRAM-NVM hybrid designs, each aimed at accelerating transformer models and on-device learning.

Event TypeResearch Manuscript

TimeWednesday, June 2610:30am - 12:00pm PDT

Location3003, 3rd Floor

Topics

Keywords

Presentations

10:30am - 10:45am PDT	Towards Redundancy-Free Recommendation Model Training via Reusable-aware Near-Memory Processing Authors Haifeng Liu Long Zheng Yu Huang Haoyan Huang Xiaofei Liao Jin Hai
10:45am - 11:00am PDT	UpDLRM: Accelerating Personalized Recommendation using Real-World PIM Architecture Authors Sitian Chen Haobin Tan Amelie Chi Zhou Yusen Li Pavan Balaji
11:00am - 11:15am PDT	MoNDE: Mixture of Near-Data Experts for Large-Scale Sparse Models Authors Taehyun Kim Kwanseok Choi Youngmock Cho Jaehoon Cho Hyuk-Jae Lee Jaewoong Sim
11:15am - 11:30am PDT	SHERLOCK: Scheduling Efficient and Reliable Bulk Bitwise Operations in NVMs Authors Hamid Farzaneh Joao Paulo De Lima Ali Nezhadi Khelejani Asif Ali Khan Mahta Mayahinia Mehdi Tahoori Jeronimo Castrillon
11:30am - 11:45am PDT	HEIRS: Hybrid Three-Dimension RRAM- and SRAM-CIM Architecture for Multi-task Transformer Acceleration Authors Liukai Xu Shuai Yuan dengfeng wang Yiming Chen Xueqing Li Yanan Sun
11:45am - 12:00pm PDT	Efficient Memory Integration: MRAM-SRAM Hybrid Accelerator for Sparse On-Device Learning Authors Fan Zhang Amitesh Sridharan Wilman tsai Yiran Chen Shan Wang Deliang Fan

DAC 2024