通过下面步骤能够非常easy产生内存泄露(程序代码不能訪问到某些对象,可是它们仍然保存在内存中):
- 应用程序创建一个长时间执行的线程(或者使用线程池,会更快地发生内存泄露)。
- 线程通过某个类载入器(能够自己定义)载入一个类。
- 该类分配了大块内存(比方new byte[1000000]),在某个静态变量存储一个强引用,然后在ThreadLocal中存储它自身的引用。分配额外的内存new byte[1000000]是可选的(类实例泄露已经足够了),可是这样会使内存泄露更快。
- 线程清理自己定义的类或者载入该类的类载入器。
- 反复以上步骤。
因为没有了对类和类载入器的引用,ThreadLocal中的存储就不能被訪问到。ThreadLocal持有该对象的引用,它也就持有了这个类及其类载入器的引用,类载入器持有它所载入的类的全部引用,这样GC无法回收ThreadLocal中存储的内存。在非常多JVM的实现中Java类和类载入器直接分配到permgen区域不运行GC,这样导致了更严重的内存泄露。
这样的泄露模式的变种之中的一个就是假设你常常又一次部署以不论什么形式使用了ThreadLocal的应用程序、应用容器(比方Tomcat)会非常easy发生内存泄露(因为应用容器使用了如前所述的线程,每次又一次部署应用时将使用新的类载入器)。
A2:
静态变量引用对象
2 | static final ArrayList list = new ArrayList( 100 ); |
调用长字符串的String.intern()
1 | String str=readString(); |
未关闭已打开流(文件,网络等)
2 | BufferedReader br = new BufferedReader( new FileReader(inputFile)); |
5 | } catch (Exception e) { |
未关闭连接
2 | Connection conn = ConnectionFactory.getConnection(); |
5 | } catch (Exception e) { |
JVM的GC不可达区域
比方通过native方法分配的内存。
web应用在application范围的对象,应用未重新启动或者没有显式移除
getServletContext().setAttribute("SOME_MAP", map);
web应用在session范围的对象,未失效或者没有显式移除
session.setAttribute("SOME_MAP", map);
不对或者不合适的JVM选项
比方IBM JDK的noclassgc阻止了无用类的垃圾回收
A3:假设HashSet未正确实现(或者未实现)hashCode()或者equals(),会导致集合中持续添加�“副本”。假设集合不能地忽略掉它应该忽略的元素,它的大小就仅仅能持续增长,并且不能删除这些元素。
假设你想要生成错误的键值对,能够像以下这样做:
3 | public final String key; |
4 | public BadKey(String key) { this .key = key; } |
7 | Map map = System.getProperties(); |
8 | map.put( new BadKey( "key" ), "value" ); |
A4:除了被遗忘的监听器,静态引用,hashmap中key错误/被改动或者线程堵塞不能结束生命周期等典型内存泄露场景,以下介绍一些不太明显的Java发生内存泄露的情况,主要是线程相关的。
- Runtime.addShutdownHook后没有移除,即使使用了removeShutdownHook,由于ThreadGroup类对于未启动线程的bug,它可能不被回收,导致ThreadGroup发生内存泄露。
- 创建但未启动线程,与上面的情形同样
- 创建继承了ContextClassLoader和AccessControlContext的线程,ThreadGroup和InheritedThreadLocal的使用,全部这些引用都是潜在的泄露,以及全部被类载入器载入的类和全部静态引用等等。这对ThreadFactory接口作为重要组成元素整个j.u.c.Executor框架(java.util.concurrent)的影响非常明显,非常多开发者没有注意到它潜在的危急。并且非常多库都会依照请求启动线程。
- ThreadLocal缓存,非常多情况下不是好的做法。有非常多基于ThreadLocal的简单缓存的实现,可是假设线程在它的期望生命周期外继续执行ContextClassLoader将发生泄露。除非真正必要不要使用ThreadLocal缓存。
- 当ThreadGroup自身没有线程可是仍然有子线程组时调用ThreadGroup.destroy()。发生内存泄露将导致该线程组不能从它的父线程组移除,不能枚举子线程组。
- 使用WeakHashMap,value直接(间接)引用key,这是个非常难发现的情形。这也适用于继承Weak/SoftReference的类可能持有对被保护对象的强引用。
- 使用http(s)协议的java.net.URL下载资源。KeepAliveCache在系统ThreadGroup创建新线程,导致当前线程的上下文类载入器内存泄露。没有存活线程时线程在第一次请求时创建,所以非常有可能发生泄露。(在Java7中已经修正了,创建线程的代码合理地移除了上下文类载入器。)
- 使用InflaterInputStream在构造函数(比方PNGImageDecoder)中传递new java.util.zip.Inflater(),不调用inflater的end()。不过new的话非常安全,但假设自己创建该类作为构造函数參数时调用流的close()不能关闭inflater,可能发生内存泄露。这并非真正的内存泄露由于它会被finalizer释放。但这消耗了非常多native内存,导致linux的oom_killer杀掉进程。所以这给我们的教训是:尽可能早地释放native资源。
- java.util.zip.Deflater也一样,它的情况更加严重。好的地方可能是非常少用到Deflater。假设自己创建了Deflater或者Inflater记住必须调用end()。