hadoop - que - LeaseExpiredException: sin error de arrendamiento en HDFS(no se pudo cerrar el archivo)

llap hive hortonworks (3)

Esto generalmente ocurre cuando varios mapeadores intentan acceder al mismo archivo. Revise su código para detectar cualquier error que haga que se acceda al mismo archivo simultáneamente. Esto también puede ocurrir cuando un asignador acceda a un archivo que ya está eliminado.

Estoy tratando de cargar datos grandes en una tabla dividida dinámicamente en HIVE.

Sigo recibiendo este error. Si cargo datos sin particionar, funciona bien. Si trabajo con un conjunto de datos más pequeño (con partición), también funciona bien. Pero para grandes conjuntos de datos empiezo a obtener este error

El error:

2014-11-10 09:28:01,112 ERROR org.apache.hadoop.hdfs.DFSClient: Failed to close file /tmp/hive-username/hive_2014-11-10_09-25-26_785_2042278847834453465/_task_tmp.-ext-10002/ pseudo_element_id=NN%09/_tmp.000002_2 org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.hdfs.server.namenode.LeaseExpiredException): No lease on /tmp/hive-username/hive_2014-11-10_09-25-26_785_2042278847834453465/_task_tmp.-ext-10002 /pseudo_element_id=NN%09/_tmp.000002_2: File does not exist. Holder DFSClient_NONMAPREDUCE_-737676454_1 does not have any open files. at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.checkLease(FSNamesystem.java:2445) at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.checkLease(FSNamesystem.java:2437) at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.completeFileInternal(FSNamesystem.java:2503) at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.completeFile(FSNamesystem.java:2480) at org.apache.hadoop.hdfs.server.namenode.NameNodeRpcServer.complete(NameNodeRpcServer.java:535) at org.apache.hadoop.hdfs.protocolPB.ClientNamenodeProtocolServerSideTranslatorPB.complete(ClientNamenodeProtocolServerSideTranslatorPB.java:337) at org.apache.hadoop.hdfs.protocol.proto.ClientNamenodeProtocolProtos$ClientNamenodeProtocol$2.callBlockingMethod(ClientNamenodeProtocolProtos.java:44958) at org.apache.hadoop.ipc.ProtobufRpcEngine$Server$ProtoBufRpcInvoker.call(ProtobufRpcEngine.java:453) at org.apache.hadoop.ipc.RPC$Server.call(RPC.java:1002) at org.apache.hadoop.ipc.Server$Handler$1.run(Server.java:1701) at org.apache.hadoop.ipc.Server$Handler$1.run(Server.java:1697) at java.security.AccessController.doPrivileged(Native Method) at javax.security.auth.Subject.doAs(Subject.java:396) at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1408) at org.apache.hadoop.ipc.Server$Handler.run(Server.java:1695) at org.apache.hadoop.ipc.Client.call(Client.java:1225) at org.apache.hadoop.ipc.ProtobufRpcEngine$Invoker.invoke(ProtobufRpcEngine.java:202) at $Proxy10.complete(Unknown Source) at org.apache.hadoop.hdfs.protocolPB.ClientNamenodeProtocolTranslatorPB.complete(ClientNamenodeProtocolTranslatorPB.java:330) at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method) at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39) at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25) at java.lang.reflect.Method.invoke(Method.java:597) at org.apache.hadoop.io.retry.RetryInvocationHandler.invokeMethod(RetryInvocationHandler. java:164) at org.apache.hadoop.io.retry.RetryInvocationHandler.invoke(RetryInvocationHandler.java:83) at $Proxy11.complete(Unknown Source) at org.apache.hadoop.hdfs.DFSOutputStream.completeFile(DFSOutputStream.java:1795) at org.apache.hadoop.hdfs.DFSOutputStream.close(DFSOutputStream.java:1782) at org.apache.hadoop.hdfs.DFSClient.closeAllFilesBeingWritten(DFSClient.java:709) at org.apache.hadoop.hdfs.DFSClient.close(DFSClient.java:726) at org.apache.hadoop.hdfs.DistributedFileSystem.close(DistributedFileSystem.java:561) at org.apache.hadoop.fs.FileSystem$Cache.closeAll(FileSystem.java:2398) at org.apache.hadoop.fs.FileSystem$Cache$ClientFinalizer.run(FileSystem.java:2414) at org.apache.hadoop.util.ShutdownHookManager$1.run(ShutdownHookManager.java:54)

establezca la opción hive.exec.parallel = false y vuelva a ejecutar la consulta.

Solo aumenta el no. de particiones permitidas predeterminadas por nodo y su trabajo debería estar bien.

SET hive.exec.max.dynamic.partitions=100000; SET hive.exec.max.dynamic.partitions.pernode=100000;