hadoop hdfs 有内网、公网ip后，本地调试访问不了集群解决

问题背景：

使用云上的虚拟环境搭建测试集群，导入一些数据，在本地idea做些debug调试，但是发现本地idea连接不上测试环境

集群内部配置hosts映射是内网映射(内网ip与主机名映射),本地只能通过公网ip访问集群

本地ide连不上内网ip，报的也是这个错误6000ms超时，连接不到内网ip(client要连内网ip是肯定连不上的)

报错信息如下:

WARN BlockReaderFactory: I/O error constructing remote block reader.

org.apache.hadoop.net.ConnectTimeoutException: 60000 millis timeout while waiting for channel to be ready for connect. ch : java.nio.channels.SocketChannel[connection-pending remote=/10.0.0.10:9866]

	at org.apache.hadoop.net.NetUtils.connect(NetUtils.java:533)

	at org.apache.hadoop.hdfs.DFSClient.newConnectedPeer(DFSClient.java:3101)

	at org.apache.hadoop.hdfs.BlockReaderFactory.nextTcpPeer(BlockReaderFactory.java:755)

	at org.apache.hadoop.hdfs.BlockReaderFactory.getRemoteBlockReaderFromTcp(BlockReaderFactory.java:670)

	at org.apache.hadoop.hdfs.BlockReaderFactory.build(BlockReaderFactory.java:337)

	at org.apache.hadoop.hdfs.DFSInputStream.blockSeekTo(DFSInputStream.java:576)

	at org.apache.hadoop.hdfs.DFSInputStream.readWithStrategy(DFSInputStream.java:800)

	at org.apache.hadoop.hdfs.DFSInputStream.read(DFSInputStream.java:847)

	at java.io.DataInputStream.read(DataInputStream.java:100)

	at org.apache.hadoop.util.LineReader.fillBuffer(LineReader.java:180)

	at org.apache.hadoop.util.LineReader.readDefaultLine(LineReader.java:216)

	at org.apache.hadoop.util.LineReader.readLine(LineReader.java:174)

	at org.apache.hadoop.mapred.LineRecordReader.skipUtfByteOrderMark(LineRecordReader.java:206)

	at org.apache.hadoop.mapred.LineRecordReader.next(LineRecordReader.java:244)

	at org.apache.hadoop.mapred.LineRecordReader.next(LineRecordReader.java:47)

	at org.apache.spark.rdd.HadoopRDD$$anon$1.getNext(HadoopRDD.scala:277)

	at org.apache.spark.rdd.HadoopRDD$$anon$1.getNext(HadoopRDD.scala:214)

	at org.apache.spark.util.NextIterator.hasNext(NextIterator.scala:73)

	at org.apache.spark.InterruptibleIterator.hasNext(InterruptibleIterator.scala:37)

	at scala.collection.Iterator$$anon$11.hasNext(Iterator.scala:408)

	at scala.collection.Iterator$$anon$11.hasNext(Iterator.scala:408)

	at scala.collection.Iterator$$anon$11.hasNext(Iterator.scala:408)

	at org.apache.spark.sql.catalyst.expressions.GeneratedClass$GeneratedIteratorForCodegenStage1.processNext(Unknown Source)

	at org.apache.spark.sql.execution.BufferedRowIterator.hasNext(BufferedRowIterator.java:43)

	at org.apache.spark.sql.execution.WholeStageCodegenExec$$anonfun$10$$anon$1.hasNext(WholeStageCodegenExec.scala:614)

	at org.apache.spark.sql.execution.SparkPlan$$anonfun$2.apply(SparkPlan.scala:253)

	at org.apache.spark.sql.execution.SparkPlan$$anonfun$2.apply(SparkPlan.scala:247)

	at org.apache.spark.rdd.RDD$$anonfun$mapPartitionsInternal$1$$anonfun$apply$25.apply(RDD.scala:830)

	at org.apache.spark.rdd.RDD$$anonfun$mapPartitionsInternal$1$$anonfun$apply$25.apply(RDD.scala:830)

	at org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD.scala:38)

	at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:324)

	at org.apache.spark.rdd.RDD.iterator(RDD.scala:288)

	at org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD.scala:38)

	at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:324)

	at org.apache.spark.rdd.RDD.iterator(RDD.scala:288)

	at org.apache.spark.scheduler.ResultTask.runTask(ResultTask.scala:87)

	at org.apache.spark.scheduler.Task.run(Task.scala:109)

	at org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:345)

	at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)

	at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)

	at java.lang.Thread.run(Thread.java:748)

19/08/21 12:14:05 WARN DFSClient: Failed to connect to /10.0.0.10:9866 for block, add to deadNodes and continue. org.apache.hadoop.net.ConnectTimeoutException: 60000 millis timeout while waiting for channel to be ready for connect. ch : java.nio.channels.SocketChannel[connection-pending remote=/10.0.0.10:9866]

org.apache.hadoop.net.ConnectTimeoutException: 60000 millis timeout while waiting for channel to be ready for connect. ch : java.nio.channels.SocketChannel[connection-pending remote=/10.0.0.10:9866]

	at org.apache.hadoop.net.NetUtils.connect(NetUtils.java:533)

	at org.apache.hadoop.hdfs.DFSClient.newConnectedPeer(DFSClient.java:3101)

	at org.apache.hadoop.hdfs.BlockReaderFactory.nextTcpPeer(BlockReaderFactory.java:755)

	at org.apache.hadoop.hdfs.BlockReaderFactory.getRemoteBlockReaderFromTcp(BlockReaderFactory.java:670)

	at org.apache.hadoop.hdfs.BlockReaderFactory.build(BlockReaderFactory.java:337)

	at org.apache.hadoop.hdfs.DFSInputStream.blockSeekTo(DFSInputStream.java:576)

	at org.apache.hadoop.hdfs.DFSInputStream.readWithStrategy(DFSInputStream.java:800)

	at org.apache.hadoop.hdfs.DFSInputStream.read(DFSInputStream.java:847)

	at java.io.DataInputStream.read(DataInputStream.java:100)

解决方案是在ide中resource的hdfs-site.xml 配置如下：意思是使用hostname连接datanode

<property>

    <name>dfs.client.use.datanode.hostname</name>

    <value>true</value>

    <description>only cofig in clients</description>

</property>

问题解决

hadoop hdfs 有内网、公网ip后，本地调试访问不了集群解决的更多相关文章

WinServer 之内网发布网站后端口映射外网访问
内网IP只能在内网局域网访问连接,在外网是不能认识内网IP不能访问的.如有路由权限,且路由有固定公网IP,可以通过路由的端口映射,实现外网访问内网.如无路由,或路由无公网IP,需要用到第三方开放的花生 ...
公司内网静态IP，外网无线动态IP 同时上网，不必再切换网卡啦 route 命令给你搞定。
一: 公司内网:192.168.55.101 255.255.255.0 192.168.55.1 网关外网:192.168.20.101 255.255.255.0 192.16 ...
service几种访问类型（集群外负载均衡访问LoadBalancer ，集群内访问ClusterIP，VPC内网负载均衡LoadBalancer ，集群外访问NodePort）
一.集群外访问(负载均衡) kind: ServiceapiVersion: v1spec: ports: - protocol: TCP port: 4341 targetPort: 8080 no ...
使用 Sealos 在 3 分钟内快速部署一个生产级别的 Kubernetes 高可用集群
本文首发于:微信公众号「运维之美」,公众号 ID:Hi-Linux. 「运维之美」是一个有情怀.有态度,专注于 Linux 运维相关技术文章分享的公众号.公众号致力于为广大运维工作者分享各类技术文章和 ...
集群重启后启动ambari-server访问Web页面无法启动集群解决
集群重启后启动ambari-server访问Web页面无法启动集群解决使用ambari部署的集群重新启动后,必须手动重启ambari-server和所有集群主机上的ambari-agent. amb ...
【Azure Developer】在Azure Resource Graph Explorer中查看当前订阅下的所有资源信息列表并导出（如VM的名称，IP地址内网/公网，OS,区域等)
问题描述通过Azure的Resource Graph Explorer(https://portal.azure.cn/#blade/HubsExtension/ArgQueryBlade),可以查 ...
【C#】C#获取本地的内网(局域网)和外网(公网)IP地址的方法
1.获取本机的IP地址集合: /// <summary> /// 获取本机所有ip地址 /// </summary> /// <param name="netT ...
[源码]K8 Cscan模块 C#获取内网主机IP/机器名/Banner/网页标题源码
[原创]K8 Cscan 大型内网渗透自定义扫描器 https://www.cnblogs.com/k8gege/p/10519321.html Cscan简介:何为自定义扫描器?其实也是插件化,但C ...
用《内网穿山甲》把本地IIS中的站点共享到远程访问
前言: 因为各种原因,我们常常要把本机或局域网中搭建的站点发给远方的人访问,他有可能是测试人员.客户.前端.或领导演示,或是内部系统内部论坛临时需要在远程访问,事件变得很麻烦,要么有公网IP,要么能控 ...

随机推荐

Bandit
CSE599:online and adaptive machine learning Lecture 3:Stochastic Multi-Armed Bandits, Regret Minimiz ...
【day03】php
一.类型判别函数库 1.安装:类型判别函数库是PHPCORE的组成部分,不用安装 2. (1)is_integer|is_int|is_long 描述: 检测变量是否是整数格式: ...
Redis删除特定前缀key的优雅实现
还在用keys命令模糊匹配删除数据吗?这就是一颗随时爆炸的炸弹! Redis中没有批量删除特定前缀key的指令,但我们往往需要根据前缀来删除,那么究竟该怎么做呢?可能你一通搜索后会得到下边的答案 re ...
[LeetCode] 190. Reverse Bits 颠倒二进制位
Reverse bits of a given 32 bits unsigned integer. Example 1: Input: 00000010100101000001111010011100 ...
[E] Shiro 官方文档阅读笔记 The Reading Notes of Shiro's Offical Docs
官方文档: https://shiro.apache.org/reference.html https://shiro.apache.org/java-authentication-guide.htm ...
.NET Core创建Worker Services
.NET CORE 3.0新增了Worker Services的新项目模板,可以编写长时间运行的后台服务,并且能轻松的部署成windows服务或linux守护程序.如果安装的vs2019是中文版本,W ...
mysql truncate 引起的 system lock，导致其他进程等待
1.现状:上线新项目,导致api服务延迟,cpu正常,内存正常,连接数正常,sql性能正常,sql进程正常(初步分析) 最后再次分析sql进程才发现由于该 truncate table name ; ...
redis在项目中的应用
redis在项目中的应用 ps:PHP 会自动关redis连接不需要手动关对于临时的数据可以不经过数据库直接redis上操作<pre>/*消息队列实例消息队列详细步骤在http ...
linux vsftp查看ftp账号信息的方法
linux vsftp查看ftp账号信息的方法查看注册的FTP账号在/etc/vsftpd/chroot_list 密码看不到只能重置密码 passwd username
NodeJS添加Jquery依赖
NodeJS使用时有时候需要JQuery依赖. 新版正确的依赖方式 var jsdom = require('jsdom'); const {JSDOM} = jsdom; const {docume ...

hadoop hdfs 有内网、公网ip后，本地调试访问不了集群解决

hadoop hdfs 有内网、公网ip后，本地调试访问不了集群解决的更多相关文章

随机推荐

热门专题